<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 미국 텍사스대 오스틴 캠퍼스 연구팀이 제로샷으로 음성 편집과 합성이 가능한 인공지능(AI) '보이스크래프트'(VoiceCraft)를 공개했다고 16일(현지시간) 기가진이 전했다.
신경 코덱 언어 모델인 보이스크래프트를 통해 매우 자연스러운 음성 편집이 가능하다. 보이스크래프트는 깃허브와 허깅페이스에 공개돼 있어 실제로 직접 사용해 볼 수도 있다.
데모용 음성을 업로드한 후 '옮겨쓰기' 버튼을 클릭하면 음성 내용이 전사된다. 텍스트 란에는 읽어줄 문장을 입력한 후 실행 버튼을 클릭하면 음성이 완성된다.
완성된 음성은 다운로드 및 재생이 가능하며 매체는 업로드한 원본 음성과 비교해도 뛰어난 품질을 자랑한다고 설명했다. 이러한 기술은 음성 편집과 합성 분야에서 혁신적인 발전을 가져올 것으로 기대받고 있다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.