단일모델 고품질 음성제작 'Zero-shot Multi-verse TTS' 선봬
엔씨소프트 판교 R&D센터 사옥(엔씨소프트 제공) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
(서울=뉴스1) 김민석 기자 = 엔씨소프트(036570)는 게임 음성제작 과정 전반에 활용할 수 있는 인공지능(AI) 모델 'Zero-shot Multi-verse TTS'(멀티버스 TTS)를 공개했다고 8일 밝혔다.
TTS(Text to Speech)는 자연어 입력 시 캐릭터 목소리 음성 콘텐츠를 제작하는 음성 합성 기술이다.
멀티버스 TTS는 3초 분량의 프롬프트 음성으로 다양한 발화 스타일 변환, 음색 일치도 높인 교차 언어 생성, 다국어 음성 제작 등을 할 수 있다.
엔씨 관계자는 "이 모델을 활용하면 제한된 음성 자원으로 고품질의 풍부한 AI 캐릭터 목소리를 제작할 수 있다"며 "기존 음성 작업보다 시간·비용을 절감할 수 있다"고 말했다.
이어 "멀티버스 TTS는 여러 언어와 기능을 가진 TTS를 하나의 모델로 제공해 다국어 음성 콘텐츠를 제작한다"며 "경쟁 TTS 모델 대비 서비스 효율이 높다"고 전했다.
엔씨는 멀티버스 TTS 모델 논문을 인공지능 관련기술 학회 'EMNLP'(Empirical Methods in Natural Language Processing)에 게재했다.
멀티버스 TTS를 통해 연내 100종 게임 캐릭터 음성을 제작하고 NPC의 성격과 상황에 맞춰 음성을 제작하는 기능을 개발할 방침이다.
ideaed@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.