수퍼톤, AI 오디오 서비스 확대…'글로벌 시장 주도권 노린다' : zum 뉴스

실시간 음성 변환 '수퍼톤 시프트' 정식 출시…창작자의 표현력 확장 기대
다국어 지원 및 사용자 맞춤형 기능 제공
오디오 전문가를 위한 '수퍼톤 에어' 출시

AI 기반 실시간 음성 변환 서비스 '수퍼톤 시프트', TTS 기술 기반의 AI 음성 서비스 '수퍼톤 플레이', 공간 음향을 추출해 재현하는 오디오 플러그인 '수퍼톤 에어'(왼쪽부터)

[이코노믹데일리] 하이브가 인수한 AI 음성 기술 전문기업 수퍼톤이 글로벌 오디오 콘텐츠 시장을 겨냥해 ‘수퍼톤 시프트’와 ‘수퍼톤 플레이’를 공개하며 AI 오디오 서비스 강화에 나섰다. 실시간 음성 변환 서비스와 극사실적 음성 생성 기능을 앞세워 창작자들이 더욱 풍부한 콘텐츠를 제작할 수 있도록 돕겠다는 계획이다.

수퍼톤은 AI 기반 음성 변환 서비스 ‘수퍼톤 시프트’를 5일 정식 출시한다고 4일 밝혔다. 이번 정식 출시는 지난해 국제 게임 전시회 ‘지스타 2023’에서 공개한 지 약 1년 만에 이뤄진 것으로 초기 사용자 피드백을 반영해 다양한 기능이 강화됐다. ‘수퍼톤 플레이’는 텍스트로부터 음성을 생성하는 TTS 서비스로 지난 10월 31일 오픈 베타 테스트에 돌입했다.

두 서비스에는 수퍼톤의 핵심 기술 ‘낸시(NANSY, Neural Analysis & Synthesis)’가 적용됐다. 낸시는 목소리를 구성하는 음색, 발음, 음고, 강세 등 요소를 분석하고 제어해 재합성하는 AI 모델로 사용자 목소리를 실시간으로 특정 캐릭터의 목소리로 변환하는 데 활용된다. 수퍼톤은 시프트 서비스의 캐릭터 보이스를 초기 10개에서 38개로 대폭 확장하고 두 주마다 신규 보이스를 추가할 예정이라고 밝혔다.

수퍼톤 시프트는 사용자 목소리를 실시간으로 원하는 캐릭터 음성으로 변환하는 기능을 제공하며 영어와 일본어 지원으로 일본 현지 창작자들의 이용 편의성을 높였다. 또한 사용자 경험을 고려해 일부 UX/UI 개선이 이루어졌다. 수퍼톤 플레이는 50개의 캐릭터별 목소리 옵션을 제공해 한국어, 일본어, 영어 등 3개 언어로 사용할 수 있다. 창작자는 상황에 맞는 목소리를 선택하고 다양한 요소를 조합해 보다 풍부한 감정 표현을 구현할 수 있다.

이번 오픈 베타 테스트에서는 감정이 담긴 음성을 생성할 수 있도록 낸시 기술이 고도화되었다. 이를 통해 울부짖거나 감정적으로 떨리는 목소리 등도 실감나게 표현할 수 있으며 사용자 피드백을 바탕으로 최종 출시 전까지 서비스를 더욱 개선해 나갈 계획이다.

수퍼톤은 일반 사용자뿐 아니라 음향 전문가들을 위한 기능도 준비했다. 11월 1일 출시된 ‘수퍼톤 에어’는 특정 공간에서 녹음된 오디오의 울림이나 반사음을 추출하고 이를 다른 오디오에 적용하는 기능을 제공하는 플러그인이다. 이를 통해 창작자들은 동굴이나 성당 등 특정 장소의 음향을 재현해 보다 생생한 오디오 콘텐츠를 제작할 수 있다. 수퍼톤 측은 수퍼톤 에어가 후반 작업의 효율성을 높이고 음향 작업의 편의성을 증대할 것으로 기대하고 있다.

이교구 수퍼톤 대표는 “수퍼톤 제품의 핵심 가치는 창작자의 상상력과 표현력 확장을 돕는 것”이라며 “기술을 지속적으로 발전시켜 창작자 의도를 깊이 있게 전달하는 스토리텔링이 가능하도록 하겠다”고 말했다.

한편 슈퍼톤은 다양한 요소를 조합하여 무한에 가까운 목소리를 생성하는 AI 오디오 기술을 보유하고 있으며 이 기술은 음악뿐만 아니라 영화, 애니메이션, 오디오북, 게임 등 다양한 콘텐츠 제작 단계에 적용될 수 있다.
선재관 기자 seon@economidaily.com

- Copyright ⓒ [이코노믹데일리 economidaily.com] 무단전재 배포금지 -

이 기사의 카테고리는 언론사의 분류를 따릅니다.