(사진=셔터스톡) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
음성 인공지능(AI) 선두 스타트업 일레븐랩스가 텍스트 설명으로 음향 효과를 생성하는 새로운 도구를 내놓았다. 최근 2주 사이 제품 3개를 출시하며 제품 다각화에 속도를 내고 있다.
벤처비트는 31일(현지시간) 일레븐랩스가 영화, 게임, 팟캐스트를 위한 텍스트-사운드 AI '사운드 이펙트(Sound Effects)'를 출시했다고 보도했다.
사운드 이펙트는 사용자의 프롬프트를 기반으로 최대 22초 길이의 사운드를 생성할 수 있으며, 다운로드 가능한 4개 이상의 오디오 클립을 제공한다.
일레븐랩스는 기반 모델의 세부 사항을 공유하지 않았지만, 스톡 미디어 플랫폼인 셔터스톡의 라이선스 트랙 오디오 라이브러리에서 모델을 훈련했다고 밝혔다.
반면 료 사용자는 무제한에 생성 오디오 클립을 상업 용도로 사용할 수 있다.
https://twitter.com/i/status/1759240084342059260
사운드 생성은 창작자들에게 큰 도움이 될 것이라는 분석이다.
현재 제작자가 소셜 비디오, 게임, 영화, TV 프로그램과 같은 콘텐츠에 음향 효과을 추가하려면, 수동으로 녹음하거나 오디오 라이브러리에서 파일을 구매해야 한다. 원하는 오디오를 찾을 수 없거나 비용이 많이 들 수도 있다.
일레븐랩스 외에도 스태빌리티 AI가 지난해 9월 음악과 음향 효과를 생성하는'스테이블 오디오(Stable Audio)'를 출시했으며, 앞서 8월에는 메타가 음악과 음향 효과를 생성하는 '오디오크래프트(AudioCraft)'를 출시했다.
국내에서는 CES에서 사티아 나델라 마이크로소프트 CEO의 관심을 끈 가우디오랩의 '폴리'가 대표적이다. 최근 클로즈드 데모 공개를 통해 한정 사용자를 대상으로 테스트 중이며, 추후 정식 출시할 예정이다. 폴리는 텍스트 입력뿐만 아니라 이미지까지 사용하는 멀티모달 방식이다.
한편 음성 AI 분야의 대표 주자로 꼽히는 일레븐랩스는 오픈AI의 음성 비서 'GPT-4o' 공개 이후 서비스 확대에 전력을 다하고 있다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.