컨텐츠 바로가기

05.29 (수)

"파파고 트레이너 되어 달라"...사람에게 도움 청한 네이버 AI 번역

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
네이버(NAVER(035420))가 번역 품질이 다소 떨어진다는 평을 받는 인공지능(AI) 기반 번역 서비스 ‘파파고’의 수준을 개선하기 위해 사용자에게 파파고 ‘훈련(트레이닝)’을 요청했다. 사용자를 참여시켜 보다 정확한 번역 데이터를 얻은 후 이를 기계 학습에 활용해 번역 품질을 높이려는 의도로 해석된다.

네이버는 16일 사용자가 참여해 인공신경망 번역 서비스 ‘파파고’를 트레이닝 하는 ‘파파고 짐(Gym)’을 시작한다고 밝혔다. 네이버는 “세계적인 선수 뒤에는 위대한 트레이너가 있듯 파파고 역시 사용자분의 번역 트레이닝이 필요하다”며 “언어를 공부하는 학습자의 마음으로, 파파고의 번역 품질 향상을 위한 재능 공유의 마음으로, 파파고 트레이너가 되어 달라”고 했다.

조선비즈

네이버의 인공신경망 번역 서비스 ‘파파고’를 트레이닝 하는 ‘파파고 짐(Gym)’ 화면.




파파고 짐은 사용자가 주어진 문장을 보고 그 아래 제시된 여러개의 번역 문장 중 적절한 것을 선택하거나 더 나은 번역을 제안하는 방식으로 운영된다. 현재 영어와 한국어 간 번역만 가능하다.

사용자는 하루에 50개 문장 번역에 참여할 수 있다. 자정 기준으로 가장 많은 선택을 받은 번역이 자동으로 채택된다. 네이버는 사용자 참여로 선정된 번역을 파파고 학습 데이터로 활용하고 파파고 번역 결과에 반영한다.

네이버는 채택된 번역 문장을 선택한 사용자에게 파파고 포인트를 준다. 네이버는 포인트를 많이 적립한 사용자에게 파파고 로고가 그려진 티셔츠나 에코백 등을 선물로 줄 예정이라고 밝혔다.

네이버가 AI 번역에 사용자의 참여를 요청한 것은 기계가 학습에 쓸 최대한 정확한 데이터를 확보하기 위해서다. 파파고는 인공신경망 기계 번역(neural machine translation·NMT) 기술을 적용한 번역 서비스다. 인공신경망(인간 두뇌를 본뜬 컴퓨터 시스템)을 적용한 NMT는 실제 사람이 하는 것처럼 의미가 더 정확하고 어순이나 문법이 더 자연스러운 번역 결과를 내놓는다.

NMT 방식의 번역 품질을 높이기 위해 필요한 것이 정확한 데이터다. 이용자가 늘면 기계가 번역 학습에 활용할 데이터가 많아지긴 하지만, 학습 데이터가 정확하지 않으면 기계 번역의 품질이 떨어질 수밖에 없다.

현재 네이버를 비롯해 구글, 카카오(035720)도 NMT 기술을 적용한 AI 번역 서비스를 하고 있다. 구글 번역이 전반적으로 번역 품질이 가장 뛰어나다는 평가를 받고 있다. 네이버는 카카오보다 먼저 파파고 서비스를 내놨지만, 번역 품질(영어와 한국어 기준)은 다소 밀린다는 평이 나온다.

조선비즈

왼쪽은 제프 베조스 아마존 창업자가 트위터에 올린 영문. 오른쪽은 네이버의 번역 결과.



미국 아마존 창업자 제프 베조스가 자신의 트위터 계정에 올린 영문을 네이버와 구글, 카카오의 AI 번역기를 이용해 한국어로 번역해봤다.

① 제프 베조스가 트위터에 올린 글
Amazon plane packed with donation of critical supplies landed earlier today in San Juan. Thank you to all the Amazonians who made it happen.

② 네이버 번역
중요한 공급품들을 기부한 아마존 비행기들이 오늘 샌 후안 주안에서 일찍 착륙했다. 그것을 성사시킨 모든 미국인들에게 감사 드립니다.

③ 구글 번역
샌프란 후안에 오늘 일찍 도착한 중요한 물자의 기증으로 가득 찬 아마존 비행기. 그 일을 만든 모든 아마존 인에게 감사드립니다.

④ 카카오 번역
아마존 비행기는 중요한 물품을 기증하여 오늘 아침 일찍 샌후안에 착륙했습니다. 이를 실현시킨 아마존인들에게 감사드립니다.

베조스가 쓴 문장은 “꼭 필요한 기부 물품을 실은 아마존 비행기가 오늘 (푸에르토리코) 산후안에 착륙했다. 이를 가능하게 해준 모든 아마조니안(아마존인·아마존 회사와 관련된 사람들)에게 감사드린다”라는 의미다.

구글과 카카오가 원문의 ‘Amazonians’를 ‘아마존인’이라고 번역한 것과 달리, 네이버는 ‘미국인’이라고 번역했다. 푸에르토리코의 수도 산후안을 가리키는 고유명사 ‘San Juan’을 네이버는 ‘샌 후안 주안’으로 중복 번역했고 구글은 ‘샌프란 후안’으로 잘못 번역했다.

김남희 기자(knh@chosunbiz.com)

<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.