일레븐랩스, 음향 효과 생성 AI '사운드 이펙트' 출시 : zum 뉴스

[박찬 기자]

(사진=셔터스톡)

음성 인공지능(AI) 선두 스타트업 일레븐랩스가 텍스트 설명으로 음향 효과를 생성하는 새로운 도구를 내놓았다. 최근 2주 사이 제품 3개를 출시하며 제품 다각화에 속도를 내고 있다.

벤처비트는 31일(현지시간) 일레븐랩스가 영화, 게임, 팟캐스트를 위한 텍스트-사운드 AI '사운드 이펙트(Sound Effects)'를 출시했다고 보도했다.

사운드 이펙트는 사용자의 프롬프트를 기반으로 최대 22초 길이의 사운드를 생성할 수 있으며, 다운로드 가능한 4개 이상의 오디오 클립을 제공한다.

일레븐랩스는 기반 모델의 세부 사항을 공유하지 않았지만, 스톡 미디어 플랫폼인 셔터스톡의 라이선스 트랙 오디오 라이브러리에서 모델을 훈련했다고 밝혔다.

사운드 이펙트는 무료로 사용할 수 있다. 대신 월 1만자로 프롬프트가 제한되며, 파일 제목에 일레븐랩스 출처가 표시된다.

반면 료 사용자는 무제한에 생성 오디오 클립을 상업 용도로 사용할 수 있다.

특히 사운드 이펙트의 경우, 사용자가 오디오 클립의 지속 시간을 직접 설정할 경우 할당량에서 초당 40자가 차감된다. 기본 오디오 지속 시간을 사용할 경우, 각 프롬프트 요청은 200자가 차감된다.

https://twitter.com/i/status/1759240084342059260

사운드 생성은 창작자들에게 큰 도움이 될 것이라는 분석이다.

현재 제작자가 소셜 비디오, 게임, 영화, TV 프로그램과 같은 콘텐츠에 음향 효과을 추가하려면, 수동으로 녹음하거나 오디오 라이브러리에서 파일을 구매해야 한다. 원하는 오디오를 찾을 수 없거나 비용이 많이 들 수도 있다.

일레븐랩스는 "풍부하고 몰입감 넘치는 음향 효과를 빠르고 저렴하게 대규모로 생성하기 위해 사운드 이펙트를 설계했다"고 밝혔다.

일레븐랩스 외에도 스태빌리티 AI가 지난해 9월 음악과 음향 효과를 생성하는'스테이블 오디오(Stable Audio)'를 출시했으며, 앞서 8월에는 메타가 음악과 음향 효과를 생성하는 '오디오크래프트(AudioCraft)'를 출시했다.

국내에서는 CES에서 사티아 나델라 마이크로소프트 CEO의 관심을 끈 가우디오랩의 '폴리'가 대표적이다. 최근 클로즈드 데모 공개를 통해 한정 사용자를 대상으로 테스트 중이며, 추후 정식 출시할 예정이다. 폴리는 텍스트 입력뿐만 아니라 이미지까지 사용하는 멀티모달 방식이다.

한편 음성 AI 분야의 대표 주자로 꼽히는 일레븐랩스는 오픈AI의 음성 비서 'GPT-4o' 공개 이후 서비스 확대에 전력을 다하고 있다.

텍스트-음성 변환 기술을 통해 웹 페이지 콘텐츠를 자동으로 설명하는 임베디드 음성 플레이어 '오디오 네이티브(Audio Native)'와 웹 페이지와 PDF, 기타 문서 등을 11가지 목소리로 음성화할 수 있는 '일레븐랩스 리더(ElevenLabs Reader)' 등을 잇달아 출시했다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>

이 기사의 카테고리는 언론사의 분류를 따릅니다.