<이미지를 클릭하시면 크게 보실 수 있습니다> |
세계 최대 콘텐츠 제작 소프트웨어(SW) 전문기업 어도비가 자사의 생성형 인공지능(AI) 모델군 '파이어플라이' 생태계 확장에 속도를 내고 있다. 텍스트를 입력해 이미지와 동영상을 만들어내는 AI에 이어, 그다음 단계로 3D(3차원)와 오디오까지 자동 생성할 수 있는 대규모 모델 개발에 착수했다.
알렉산드루 코스틴 어도비 생성형 AI 총괄 부사장(사진)은 15일(현지시간) 미국 플로리다주 마이애미에서 열리고 있는 세계 최대 크리에이티브 콘퍼런스 '어도비 맥스 2024' 현장에서 취재진과 만나 "어도비의 최대 경쟁력은 콘텐츠 창작에 대한 투자"라며 "(현재) 3D 생성형 AI 모델과 오디오 모델을 연구하고 있다"고 말했다.
코스틴 부사장은 "이용자들이 생성형 AI를 활용해 보다 더 쉽게 자신이 하고 싶은 이야기를 구현하고, 그만큼 시간을 아낄 수 있도록 하는 것이 우리의 목표"라며 어도비의 생성형 AI 로드맵에 대해 밝혔다.
어도비는 전날 영상 촬영분에서 중간중간 빠진 부분이 있을 경우 AI가 앞뒤 흐름에 맞는 영상을 만들어 컷과 컷 사이의 간극을 채워주는 생성형 동영상 AI 솔루션을 공개한 바 있다. 생성형 동영상 AI의 후속 프로젝트를 묻는 질문에 코스틴 부사장은 "현재도 오디오 백그라운드 익스텐션(배경음 확장)을 통해 오디오를 2초 정도 늘릴 수 있는 등 기존 오디오 모델이 있다"면서도 "그러나 음악을 (자동) 생성하는 데 있어 임팩트 있는 생성이 중요한 만큼, 영상이 보다 더 생생하게 느껴질 수 있도록 음향 효과와 음악을 만들어내는 (진보된) 생성형 오디오 모델을 강구하고 있다"고 전했다.
가령 눈길을 걸어가는 영상에서 배경음으로 실존하는 음향처럼 구현할 수 있는 오디오 AI를 염두에 두고 있다는 얘기다. 그는 또 "3D 모델 역시 연구하고 있고, 이러한 모델들은 우리가 전문성을 갖고 (기술력을 확보해 나가고 있는) 전문 영역"이라고 설명했다.
다만 코스틴 부사장은 후속 모델 공개 시점을 공언하지 않았다. 그러나 이미지·동영상 AI를 불과 1년여 차이로 잇달아 내놓았다는 점에서 3D와 오디오 생성 모델 역시 속도감 있게 출시할 수 있을 것으로 보인다.
이와 관련해 어도비는 이날 부대 행사인 '맥스 스닉스'에서 텍스트 입력만으로 오디오와 3D 객체가 생성되는 신기술을 시현하며 관련 프로젝트의 상용화가 임박했음을 예고하기도 했다.
[마이애미 고민서 기자]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.