인공지능 성우 '코난보이스'가 최신 음성기술을 탑재했다. 제공=코난테크놀로지 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
코난테크놀로지(대표 김영섬)가 인공지능 성우 '코난보이스'에 최신 음성 기술을 적용해 음성 AI 기술력을 한 단계 높였다고 밝혔다.
코난보이스는 사용자의 목소리를 다양한 언어로 변환할 수 있는 새로운 음성합성 모델을 18일 공개했다. 발음기호를 언어마다 다르게 사용하는 대신 국제음성기호(IPA) 기반의 공통 발음기호를 사용해 한 사람의 목소리로 여러 언어의 음성합성이 가능한 모델이다. 성우 고유의 억양과 음성 특성은 유지한 채 여러 외국어를 원어민에 가까운 수준으로 충실하게 합성해주며, 별도의 원어민 성우 섭외나 추가 녹음 없이도 여러 언어를 구사할 수 있는 것이 장점이다. 기존의 텍스트 기반 음성합성에서 진일보한 시도인 동시에, 다국어 음성합성에 대한 고객들의 꾸준한 니즈를 반영했다. 현재 한국어 및 영어를 제공하고 있으며 추후 일본어, 중국어 등으로 늘려갈 계획이라고 관계자 측은 설명했다.
관계자는 “최신 음성 모델의 알고리즘은 기존 대비 크기가 콤팩트해졌으며 효율적으로 음성을 생성해 화자의 표현력을 손실 없이 구현할 수 있게 되었다”라며 “Flow 기반의 최신 기법을 적용해 트랜스포머 신경망 모델 대비 연속성이 보강된 원활한 입출력 흐름으로 더 자연스러운 음성을 생성할 수 있게 됐다”라고 말했다.
이어서 “서비스도 업데이트됐다”라며 “1080p FHD 해상도가 추가돼 고화질 영상 제작을 지원하고, 자막 서비스가 신설돼 영상 품질과 제작 편의성을 높였다”라고 덧붙였다
서영주 음성 그룹 연구소 상무는 “코난보이스 사용자들이 더욱 다양하고 풍부한 콘텐츠를 쉽게 만들 수 있도록 앞으로도 최신 인공지능 음성 기술 개발과 고도화에 박차를 가하겠다”라고 소감을 전했다.
한편, 코난보이스는 인공지능 음성합성 제작 서비스로, 경쟁사 대비 33배 빠른 속도 및 고품질의 음성이 특징이다. 239명의 AI 음성, 3D 캐릭터 자동 제작, 커스터마이징 배경 화면 등 다양한 작업을 지원한다.
유은정 기자 judy6956@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.