韓 대표 AI 음성인식 서비스 '클로바·다글로' 비교
맞춤법 오류는 비슷, 단어 인식은 다글로가 더 정확
챗GPT는 클로바노트 승리로 판정, 기자는 다글로
[이데일리 김가은 기자] 11년 전 대학생 시절, 교수님의 열정적인 강의를 듣다가도 졸음이 찾아올 때가 있었다. 정신을 차려보면 필기를 하던 노트북 화면에는 정체를 알 수 없는 자음과 모음들의 배열들이 가득 떠있었다. 녹음을 하기도 했지만 나중에 다시 들으며 하나하나 글로 바꾸는 일도 고역이 아닐 수 없었다.
요즘 대학생들은 필기가 한결 수월해졌다. 인공지능(AI) 음성 변환 애플리케이션인 네이버 ‘클로바노트’와 액션파워 ‘다글로’ 등이 존재해서다. AI 음성 변환 서비스는 기자에게 있어서도 한 줄기 희망이다. 취재할 내용은 많고, 노트북 배터리는 떨어져 손가락을 놀릴 수 없을 때 믿을 구석이라고는 다글로나 클로바노트 밖에 없다.
엔씨소프트 스위칭 RPG 신작 ‘호연’ 쇼케이스를 네이버 클로바노트(왼쪽)와 액션파워 다글로로 녹음해 텍스트로 변환했다.(사진=김가은 기자) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
그러나 항상 정확도가 아쉬웠다. 녹음된 음성을 글로 변환한 뒤 살펴보면 당최 알 수 없는 단어들이 곳곳에 존재했었기 때문이다. 결국에는 맥락으로 의미를 파악하거나 다른 기자들의 필기와 비교점검 할 수 밖에 없었다. 기자도 애용하는 앱들인 만큼 어떤 것이 더 정확하고 자연스럽게 음성을 글로 바꿔주는지 궁금해졌다.
클로바노트는 음성인식, 자연어처리 등 네이버의 AI 기술을 접목한 앱이다. 지난 2020년 11월 국내 출시 이후 한국과 일본 등에서 흥행하며 신규 가입 건수 또한 350만건을 훌쩍 넘었다. 현재 초거대 AI ‘하이퍼클로바’를 적용해 회의록 요약, 노트 공유, 하이라이트 표시 등까지 제공하는 AI 회의록 관리 서비스로 발전했다. 현재 네이버는 연내 출시를 목표로 ‘클로바노트’ 기업용 서비스도 준비 중이다. 기존 클로바노트와는 달리 회사 이메일 주소를 사용한 로그인, 2단계 인증, 접속 단말기 제어 등 보안을 강화한 점이 특징이다.
대학생 필수앱으로 자리매김한 다글로는 지난 2017년 출시됐다. 클로바노트 보다 3년 먼저 출시된 다글로는 국내 최초의 ‘스피치-투-텍스트(STT)’ 서비스이기도 하다. 실제로 써본 다글로는 단순히 녹음한 음성을 넘어 영상에 담긴 소리까지 변환해주는 ‘멀티모달’ 기능을 갖추고 있었다. 영상 파일을 업로드 하거나 유튜브 링크를 붙여넣을 수 있는 것이다. 긴 강의 영상 속에서 중요한 부분만 빠르게 파악하고 싶을 때 유용하게 사용할 수 있다.
대결을 위해 먼저 녹음할 콘텐츠를 선정해야 했다. 고민 끝에 최근 ‘위기 탈출’과 변화를 위해 노력 중인 국내 게임사 엔씨소프트(036570)가 최근 진행한 스위칭 역할수행게임(RPG) 신작 ‘호연’ 쇼케이스 영상을 두 앱으로 녹음하기로 했다. 해당 영상은 유명 크리에이터인 ‘테스터훈’이 엔씨 사옥을 찾아가 호연을 리뷰하는 내용이었다.
챗GPT가 분석한 네이버 클로바노트와 액션파워 다글로 서비스의 정확도(사진=김가은 기자) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
약 1분 정도를 동일하게 녹음해 글로 변환했다. 두 서비스가 내놓은 결과물 모두 맞춤법이 틀렸거나, 단어를 잘못 인식한 경우가 존재해 육안으로 비교하기는 어려웠다. 그래서 챗GPT에게 ‘글 2개를 줄 건데 둘 중에 뭐가 더 맞춤법이 정확한 지 분석해봐’라고 명령했다. 챗GPT가 정한 승자는 네이버 클로바노트였다. 네이버 클로바노트가 변환한 글의 맞춤법 정확도는 45.45%, 다글로는 33.33%로 집계됐다. 또 “두 글 모두 맞춤법과 문장 부호에서 오류가 있지만, 첫 번째 글(클로바노트)이 두 번째 글보다 약간 더 정확하다”며 “첫 번째 글의 오류가 비교적 덜하고 문장이 더 자연스럽게 구성돼 있다”고 설명했다.
챗GPT는 클로바노트의 손을 들어줬지만 기자가 판단했을 때는 다글로가 더 자연스러웠다. 먼저 두 글의 맞춤법 오류 차이는 그다지 크지 않았다. 클로바노트가 5곳, 다글로가 4곳이었다. 다만 단어 인식 측면에서는 다글로가 더 정확했다. 예를 들어 “섭외가 왔을 때 괜찮을까? 그런데 빈 말은 안하겠습니다”라는 문장을 클로바노트는 “선배가 왔을때 괜찮을까? 근데 뒷말은 안하겠습니다”라고 표기했다. 반면 다글로는 정확했다.
이번 테스트는 동일한 환경인 기자의 집에서 같은 노트북, 같은 볼륨으로 진행됐다. 다만 한 번의 대결로 두 서비스 중 어떤 것이 더 낫다고 말할 수는 없다. 지금으로서는 완벽히 만족할 만한 앱이 등장하지 않은 만큼, 이용자별로 쓰기 쉽다고 느끼는 서비스를 선택하면 된다. 어찌 됐든 두 서비스 모두 없어서는 안 될 존재가 돼버렸다. 대학생은 물론, 산업계에서도 활용도가 무궁무진하다. AI가 일상생활 속에 성큼 들어온 요즘은 이같은 서비스를 잘 활용하는 사람이 슬기로운 학업, 업무가 가능할 것 같다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.