<이미지를 클릭하시면 크게 보실 수 있습니다> |
음성통화 내용을 문자로 변환해주는 앱 '비토(VITO)'를 운영 중인 리턴제로가 한국어 음성인식 성능을 대폭 개선한 업데이트를 실시했다고 19일 밝혔다.
리턴제로는 사람의 육성을 넘어 ARS 음성을 검출해내는 기술 개발에 성공했다. ARS를 포함한 다자간 자유발화 대화에서 인공지능(AI)으로 ARS 음성을 검출해 낸 사례는 비토가 처음이다.
언어모델 분석 시 ARS가 발화한 대화까지 포함하면 대화 내용과 관계없는 자동응답 내용이 화자간 대화 속에 끼어들어 가독성을 떨어뜨린다. 비토는 이러한 자동응답 음성을 인식하고 구분해 표기함으로써 대화창의 가독성을 대폭 개선했다.
기존 음성인식 엔진은 실제 소리가 나는 간격에 맞춰 받아 적는 작업 중심이라 변환된 텍스트가 문장으로 매끄럽게 이어지지 않거나 문법적 표기가 틀린 경우가 빈번했다.
비토는 업데이트를 통해 통화음성 인식 구간의 범위를 실제 소리가 난 구간이 아닌 사람의 대화가 이뤄지는 구간으로 보다 정교하게 재설정했다.
리턴제로는 앞으로도 기술 진화를 거듭해 나갈 계획이다. '어, 음, 그' 등 의미 없이 사용되는 간투어와 욕설에 대한 필터링 기능을 강화하고 통화 시 기존 대화 내용을 요약해 제공해주는 오버레이 기능도 추가로 선보일 예정이다.
이참솔 리턴제로 대표는 "이번 업데이트를 통해 통화내용을 보다 정확하게 텍스트로 구현해내는 음성인식 서비스를 체감할 수 있을 것"이라며 "서비스를 계속 고도화해 음성 AI 시장의 혁신을 이어 나갈 것"이라고 강조했다.
최태범 기자 bum_t@mt.co.kr
<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.