컨텐츠로 건너뛰기
검색
테크M 언론사 이미지

[써봤다] 20초만에 AI로 만든 내 목소리...콜센터 지형도 바꾸는 휴멜로 '프로소디'

테크M
원문보기

[써봤다] 20초만에 AI로 만든 내 목소리...콜센터 지형도 바꾸는 휴멜로 '프로소디'

속보
환율, 전일대비 9.5원 내린 1440.3원 마감
[허준 편집장]


사람의 목소리를 똑같이 흉내 내는 인공지능(AI) 기술이 비약적으로 발전하고 있다. 단순히 텍스트를 읽어주는 수준을 넘어, 감정과 억양까지 재현하는 '보이스 클로닝'(Voice Cloning) 기술이 상용화 단계에 접어들었다.

실제 기자가 휴멜로의 음성 합성 엔진 '다이브'(DIVE)를 적용한 음성합성(TTS) 플랫폼 '프로소디'를 직접 체험해보니, 단 20초 음성 데이터만으로 고품질 AI 목소리를 생성할 수 있었다. 이 기술은 향후 콜센터와 드라이브스루 등 다양한 산업 현장의 풍경을 바꿀 것으로 기대된다.

"20초 녹음으로 나만의 AI 성우 탄생"...직관적인 사용성 돋보여

프로소디를 이용하려면 스마트폰보다는 PC나 노트북이 더 적합하다. 휴멜로에서는 크롬 웹브라우저 기반 PC 환경을 권장한다. 프로소디에 접속해 '바로 체험하기' 버튼을 누르자 직관적인 UI가 나타났다.

과정은 놀라울 정도로 간단했다. 회원가입 후 권한을 부여받고, 'DIVE' 메뉴에서 2초에서 20초 분량의 내 목소리 파일을 녹음했다. 핵심은 업로드한 음성 파일의 내용과 토씨 하나 틀리지 않게 정확한 텍스트를 입력하는 것이었다. 기존 녹음 파일이 있다면 그대로 사용하는 것도 가능하다.

텍스트 입력 후 '음성 생성' 버튼을 누르자, 기자의 목소리 톤과 습관이 그대로 묻어나는 AI 음성이 순식간에 만들어졌다.


디테일한 발음 교정 기능도 인상적이었다. '사용자 정의 사전' 기능을 통해 외래어나 약어의 발음을 지정할 수 있었다. 예를 들어 'ChatGPT'를 입력하고 치환 단어에 '챗지피티'라고 설정하면 AI가 이를 자연스럽게 한국어 발음으로 읽어냈다. 특정 업계나 기업에서 관용적으로 읽는 약어 등에 유용할 것으로 보인다.

생성된 목소리는 스트리밍 모드를 끄고 '북마크' 기능을 이용해 저장해두면, 언제든지 다른 텍스트를 읽히는 데 재사용할 수 있어 편의성이 높았다.

콜센터부터 차 안 비서까지...산업 지형도 바꾼다

휴멜로의 DIVE 엔진은 단순히 AI 목소리를 재현하는 차원을 넘어 산업계 전반에 혁신을 예고하고 있다. DIVE 엔진은 API 형태로 제공돼 다양한 서비스에 즉각적으로 접목할 수 있기 때문이다.


가장 큰 변화가 예상되는 곳은 콘택트센터(고객지원) 분야다. 기존의 ARS나 스크립트 봇은 정해진 답변만 가능해 고객의 답답함을 유발했다. 그러나 DIVE 기술이 적용된 'AI 보이스 에이전트'는 고객의 말을 이해하고 자연스러운 대화로 문제를 해결할 수 있어, 상담원 연결 대기 시간을 없애고 자체 해결률을 비약적으로 높일 것으로 기대된다.


레스토랑 및 리테일 업계에서도 '전화 주문'과 '드라이브스루' 풍경이 바뀔 전망이다. 피크 시간대 빗발치는 전화를 AI가 동시에 처리해 응대율을 100% 가까이 끌어올릴 수 있을 것으로 기대된다. 시끄러운 드라이브스루 환경에서도 정확한 주문 처리가 가능해지지 않을까.

모빌리티 분야에서는 차량 내 경험을 혁신한다. 기존 음성 명령이 내비게이션 조작 정도에 그쳤다면, 생성형 AI 기반의 차량 비서는 운전자와 대화하며 정보 탐색은 물론 차 안에서 주문과 결제(보이스 커머스)까지 원스톱으로 연결한다. 이는 운전자의 주의 분산을 막고 새로운 구매 경험을 제공할 것으로 보인다.


물론 AI 음성합성이 보이스피싱 등 범죄에 악용될 수 있다는 우려도 있다. 휴멜로는 이를 막기 위해 개인의 목소리를 클로닝하는 DIVE 기능은 사업자등록번호가 있는 법인 및 개인사업자에 한해 권한을 부여한다. DIVE 엔진 사용기록이 남기 때문에 범죄에 악용될 수 있는 여지를 사전에 막는 셈이다.

일반 회원은 DIVE 기능없이 휴멜로가 제공하는 60여개 프로파일 목소리를 이용할 수 있다. 각 음성은 중립, 화난, 슬픈, 행복한, 차분한 등 감정을 선택해 목소리의 톤을 조절할 수 있다.

휴멜로 관계자는 "DIVE는 고도화된 음성 합성 기술로 단순한 편의 기능을 넘어, 기업의 운영 효율을 높이고 고객 경험을 혁신하는 핵심 솔루션이 될 것"이라고 전망했다.

허준 기자 joon@techm.kr

<저작권자 Copyright ⓒ 테크M 무단전재 및 재배포 금지>