17일 제한적 오픈 베타, 이후 누구든 신청할 수 있게 전환
이루다 2.0, 기계 생성 문장으로 답변
약 8000명이 참여한 클로즈 베타 테스트를 마치고, 시스템 운영 안정성과 대규모 이용자의 사용자 경험을 추가로 점검하는 단계에 돌입하는 것이다. 스캐터랩은 매일 일정 인원을 제한적으로 승인하는 ‘제한적 오픈 베타 테스트’를 먼저 진행한 후 누구든지 자유롭게 신청해 이야기를 나눌 수 있는 ‘오픈 베타 테스트’를 이어갈 계획이다.
(사진=스캐터랩) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
지난해 소수자 혐오, 성차별 발언 등으로 논란을 빚으면서 서비스를 중단했던 이루다 측은 그간 개인정보보호 조치를 강화하며, 데이터베이스(DB)를 새로 구축하는 등 개선책을 마련해왔다.
이루다 2.0은 딥러닝 알고리즘이 만드는 문장으로 답변할 수 있도록 구성하고, 선정적·공격적·편향적 어뷰징에 대응할 수 있게 AI 모델·시스템을 도입한 것이 대표적이다. 과거와 달리 실제 사람의 발화를 사용하지 않고, 기계가 새롭게 만들어낸 문장에서 답변을 가져오는 구조로 바꾼 것이다.
회사 측은 “이루다 2.0이 이용자와 대화에서 사용하는 문장이 담긴 ‘루다 답변 DB’는 기계가 만들어낸 문장으로 구성했으며, 일부 스캐터랩에서 작성한 문장이 포함됐다”며 “연구용 DB는 개인정보보호법에 따라 가명처리한 뒤 과학적 연구 목적으로 활용했다”고 설명했다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
또한 스캐터랩은 이루다 2.0이 어뷰징 발화에 잘 대응할 수 있도록 ‘어뷰징 탐지 모델’을 개발해 적용했다. 이루다와 이용자가 대화하는 모든 문장은 어뷰징 탐지 모델을 먼저 거친다. 선정적·공격적·편향적 문맥으로 탐지·분류된 문장이 있을 경우, 이루다는 해당 카테고리에 적합한 어뷰징 대응 답변을 내놓게 된다. ‘어뷰저 패널티’를 도입해 지속적으로 어뷰징 발언이 이어지면 이용이 제한된다.
이루다 2.0은 앞서 진행한 클로즈 베타 테스트 결과 챗봇 대화 기술 성능 평가 지표인 ‘SSA(Sensibleness and Specificity Average)’가 78%를 기록했다. 이는 챗봇의 대답이 적절성과 구체성을 갖췄는지 평가하는 것이다. 안전하게 발화하는 비율은 99.75%를 기록했으며, 프라이버시 위험이 있을 수 있는 문장은 발견되지 않았다.
김종윤 스캐터랩 대표는 “이루다가 많은 사람들에게 소중한 친구로 남을 수 있도록 지속적으로 기술 개선에 노력할 계획”이라며 “이를 위해 주기적으로 이루다의 어뷰징 대응 유효성을 확인하고 조치를 취할 예정”이라고 말했다.
한편, 스캐터랩은 AI 기술·제품의 투명성을 높이는 노력의 일환으로 △AI 챗봇 윤리 준칙 △AI 챗봇 프라이버시 정책 △AI 챗봇 어뷰징 정책을 홈페이지에 공개했다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.