컨텐츠로 건너뛰기
검색
디지털데일리 언론사 이미지

AI 영상에 ‘내 캐릭터’ 직접 등장…알리바바 ‘WAN 2.6’ 공개

디지털데일리 이안나 기자
원문보기

AI 영상에 ‘내 캐릭터’ 직접 등장…알리바바 ‘WAN 2.6’ 공개

속보
경찰 "쿠팡, 노트북 제출 때 '포렌식' 진술 안 해...조작 증거면 엄정 조치"



[디지털데일리 이안나기자] 알리바바는 비주얼 생성 모델 최신 버전인 ‘완(Wan) 2.6’ 시리즈를 공개했다고 17일 밝혔다. 이번 업데이트는 참조 기반 영상 생성 기능을 중심으로 다중 장면 구성과 음성·영상 결합 표현을 강화한 것이 특징이다.

Wan 2.6 시리즈에는 새로운 참조 기반 영상 생성 모델과 함께 기존 모델 전반에 대한 성능 개선이 포함됐다. 핵심 기능인 ‘완 2.6 R2V(Reference to Video)’는 사용자가 외모와 목소리가 포함된 참조 영상을 업로드하고 텍스트 지시어를 입력하면 동일한 캐릭터가 등장하는 새로운 영상 장면을 생성하는 방식이다. 단일 인물뿐 아니라 동물이나 사물, 복수의 대상이 포함된 장면도 생성할 수 있다. 참조 영상의 시각적 특징과 음성을 일관되게 유지하도록 설계됐다.

알리바바는 이 기능이 시각과 음성을 함께 참조하는 멀티모달 생성 기술을 기반으로 하며 중국에서 처음 공개된 참조 기반 영상 생성 모델이라고 설명했다. 이를 통해 사용자가 자신이나 특정 대상을 AI 생성 영상 속 주체로 직접 활용할 수 있도록 했다.

Wan 2.6 시리즈는 텍스트-영상 생성, 이미지-영상 생성, 이미지 생성 등 기존 모델 전반에 걸쳐 업그레이드가 이뤄졌다. 다중 장면으로 구성된 영상에서도 시각적 일관성을 유지할 수 있도록 멀티샷 스토리텔링 기능을 강화했으며, 오디오와 영상의 동기화 정확도를 높이고 음성을 기반으로 장면을 생성하는 기능도 보완됐다.

영상 출력 길이는 최대 15초까지 지원된다. 이를 통해 단일 장면 중심의 짧은 영상에서 벗어나 보다 확장된 구조의 스토리 전개가 가능하도록 했다. 텍스트 지시어 해석 정확도와 시각적 품질도 개선돼, 비교적 복잡한 연출이 필요한 영상 제작에도 활용할 수 있도록 했다.

이미지 생성 영역에서는 텍스트와 이미지를 교차 출력하는 방식으로 시각적 흐름을 유지할 수 있으며 예술적 스타일 제어와 사실적인 인물 표현, 이미지 편집 기능도 강화됐다. 중국어와 영어를 포함한 긴 문장의 지시어에 대한 이해 능력을 높여, 세부적인 표현 의도를 반영할 수 있도록 설계됐다.


Wan 2.6 시리즈는 알리바바 클라우드 AI 개발 플랫폼 ‘모델 스튜디오’를 비롯해 Wan 공식 웹사이트를 통해 이용할 수 있으며, 향후 알리바바의 AI 애플리케이션 ‘큐원(Qwen)’ 앱에도 통합될 예정이다.

알리바바는 올해 초 처음 공개한 Wan 시리즈를 지속적으로 개선해 왔으며 이번 업데이트를 통해 멀티미디어 생성 기술 영역에서의 활용 범위를 확대한다는 계획이다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -