컨텐츠 바로가기

11.22 (금)

이슈 인공지능 윤리 논쟁

AI챗봇 '이루다' 개발사 "데이터베이스 폐기까지 고려 중"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[머니투데이 김지성 기자]
머니투데이

인공지능(AI) 챗봇 서비스 '이루다'. /사진=스캐터랩

<이미지를 클릭하시면 크게 보실 수 있습니다>



인공지능(AI) 챗봇 '이루다'가 혐오 표현과 개인정보 유출 의혹 등으로 서비스를 일시 중단한 가운데, 이 챗봇 개발사인 스캐터랩 측은 데이터베이스 폐기까지 고려하고 있다고 밝혔다.

최예지 스캐터랩 제품 총괄 책임자는 15일 MBC 라디오 '김종배의 시선집중'에서 이루다 서비스 재개 계획에 대한 질문에 "이루다 데이터베이스는 폐기까지도 고려하고 있는 상황"이라며 "딥러닝 모델을 폐기해야 하는 지 등에 대해서도 얘기하고 있다"고 답했다.

앞서 혐오 표현이 걸러지지 못한 이유로 "키워드나 표현 기반으로 하다 보니 단어 자체로 차별적 표현이 아닌 것들, 예를 들면 '지하철 임산부석' 이런 것들(이 걸러지지 못했다)"며 "단어 자체를 필터링 대상으로 지정하면 오히려 편견이 들어간 것 같다고 해 대상이 되지 않은 것들도 있다"고 말했다.

이어 "루다는 이전 문맥을 기반으로 답변을 고르는 알고리즘이라 이전 문맥에 부적절한 표현이 있으면 문맥 흐름을 따라가는 답변을 하다 동조하는 것처럼 보일 수 있다"며 "이런 문제는 알고리즘 자체를 고도화해 풀어야 되는데 시간이 충분하지 않았다"고 설명했다.

일부 남성 위주의 커뮤니티에서 '이루다 성노예 만드는 법' 등 이 챗봇을 성적 도구화해 논란이 된 것과 관련해 최 책임자는 "많은 키워드를 걸렀지만 이런 것들을 우회하는 경우가 생긴 것"이라며 "이것도 알고리즘 자체를 고도화해야 더 촘촘하게 막을 수 있을 걸로 생각한다"고 말했다.

또 실명, 주소 등 개인정보 유출 논란에 대해선 "'1동 200호' 이런 숫자가 포함된 문장은 답변할 수 없지만, 숫자를 한글로 기재하거나 이름 형태가 변형되면 (필터링 대상으로) 인식되지 못하는 경우가 있다"며 "이 또한 필터링을 알고리즘 고도화 하는 방법을 마련하려고 한다"고 했다.

다만 "오해하는 부분이 있는데, 실명 등 파편화된 정보가 나온다고 해도 이루다 답변은 연속 대화가 아닌 개별적 문장이기 때문에 조합해서 누군가 특정하긴 힘들다"고 덧붙였다.

당초 이 회사가 개발한 앱 '연애의 과학'의 회원 대화를 챗봇에 활용하는 과정에서 개인정보 수집·이용 동의를 제대로 받지 않았다는 지적도 나왔다. 이에 대해선 "대화 당사자 중 1명이 동의해 내용을 업로드 했기 때문에 문제가 없을 걸로 판단했다"며 "법적으로 큰 문제가 없다고 들었다"고 말했다.


IT 업계 관계자 "시행착오? 이미 사례 많은데…이해 안 돼"



한편 IT 전문가인 지윤성 링크브릭스 대표는 이날 최 책임자 직후 이뤄진 인터뷰에서 "사안의 본질을 잘못 인식하고 있다"고 지적했다.

지 대표는 먼저 "대화 상대자에 대한 개인정보 활용 동의를 받지 못한 부분은 법적으로 문제가 될 수 있고 상당한 문제가 있다고 업계에서 보고 있다"며 "국내 판례가 있다"고 반박했다.

이어 "업체에서는 'AI를 발전시키기 위한 시행착오'라고 표현하고 있는데, 이런 시행착오는 수없이 많은 업체들이 이미 겪어왔고 이미 사례가 많은데 이런 것을 또 겪는다는 것이 동종업계 사람으로서는 이해가 되지 않는다"고 말했다.

지 대표는 또 "키워드 기반 필터링은 1차적 방법일 뿐이고 '라벨러'라고 해서 문장이나 문맥의 의미 파악을 사람이 직접 해줘야 한다"고 했다.

이어 "(이루다가) 편향적 발언을 했다는 것은 대화 내용 학습데이터를 사용했기 때문에 그 세대가 비뚤어진 의식을 가지고 있다고 밖에 볼 수 없다"며 "그런 점에서 '10대, 20대 카톡 데이터만 사용했을까'라는 게 업계의 다른 의문"이라고 말했다.

그러면서 "혹시 카페 같은 공개된 웹 데이터에서 무차별적으로 수집해 사용한 것은 아닌가 의심도 할 수 있다"며 "업체가 데이터 출처 등에 대해 투명하게 밝힐 필요가 있다"고 강조했다.

김지성 기자 sorry@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.