컨텐츠 바로가기

03.29 (금)

목소리 구별하는 'AI 화자인식' 어디까지 왔나

댓글 1
주소복사가 완료되었습니다

구글과 카카오 이어 네이버도 서비스 '채비'

뉴스1

화자인식 서비스를 처음 도입한 AI스피커 '구글홈'© News1

<이미지를 클릭하시면 크게 보실 수 있습니다>


(서울=뉴스1) 차오름 기자 = 구글과 카카오가 인공지능(AI) 스피커에 화자인식 기술을 적용한 가운데 네이버도 화자인식을 활용한 서비스를 준비중이다. 화자인식 기술은 어느 수준까지 왔을까.

12일 이봉진 네이버 클로바 개발자는 서울 삼성동 코엑스에서 열린 개발자 콘퍼런스 '데뷰(DEVIEW) 2018'에서 "목소리별로 차별화된 응답을 제공하는 화자인식기를 개발중"이라며 "기술수준은 경쟁사에 뒤처지지 않지만 서비스 방식을 고민하고 있다"고 밝혔다.

화자인식은 이용자의 음성에서 성별, 나이, 언어, 감정 등 특징을 추출해 누구의 목소리인지 구별하는 기술이다. 결제·송금·잠금해제 등 인증수단이나 뉴스·음악·일정알림 등 개인화 추천 서비스에 활용할 수 있다.

이 기능은 지난해 4월 '구글홈'이 가장 먼저 지원했다. 구글홈의 '보이스매치' 기능은 목소리를 등록한 이용자에게 하루일정, 뉴스브리핑, 기기찾기, 음악 재생목록 등 맞춤형 서비스를 제공한다. 목소리 정보는 이용자에게 '오케이 구글' 등을 말해보라고 요구해 학습한다. 답변하는 정보는 이용자의 구글 계정 기반이다.

카카오미니가 지난 11일 베타서비스를 시작한 '보이스프로필' 기능도 구글홈과 원리가 같다. 등록을 위해 이용자에게 '헤이 카카오 안녕' 등 문장을 말해보라고 해 목소리를 학습한다. 제공정보는 카카오톡 계정 기반이다. 카카오미니의 보이스프로필은 현재 이름·생일·나이 등을 답변해주는 기본적인 수준으로 향후 음악추천, 카카오톡 읽어주기 등 서비스를 확대해나갈 계획이다.

네이버의 화자인식 서비스도 이와 유사하게 작동할 것으로 보인다. 네이버는 이 기술을 '라인' 메신저에서 메시지를 읽어준다거나 등록된 발화자에 따라 상품주문, 결제 등을 연동하는 방안 등을 검토중이다. 이를 위해 네이버 계정을 연동할 수 있다.

네이버와 카카오는 화자인식 서비스에 목소리를 몇 명까지 동시에 등록할 수 있게 만들지도 고민하고 있다. 구글홈은 6명까지 가능하며 카카오는 1명만 가능한 상태다. 이에 대해 이봉진 개발자는 "1명, 6명, 10명, 20명, 50명, 100명 등 목소리를 등록해놓고 화자인식 정확도를 시험해봤다"며 "5명까지는 오류가 없었지만 6명부터 성능이 떨어져 100명이 될땐 10% 이상 인식률이 떨어졌다"고 밝혔다.

등록과정없이 서로 다른 사람의 목소리를 구분할 수 없다는 점은 한계로 꼽힌다. 현재 화자인식을 하려면 한 사람이 한 문장을 명확하게 말한 데이터가 필요하다. 또 기기를 부르는 호출어 없이 '길 알려줘' 등 명령어만 말했을 때 누구인지 인식하지 못한다.
rising@news1.kr

[© 뉴스1코리아(news1.kr), 무단 전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.