컨텐츠로 건너뛰기
검색
뉴스1 언론사 이미지

"크리에이터 맞춤 비주얼 생성" 알리바바 최신 AI '완 2.6' 공개

뉴스1 김민석 기자
원문보기

"크리에이터 맞춤 비주얼 생성" 알리바바 최신 AI '완 2.6' 공개

서울맑음 / -3.9 °

中 첫 '참조 기반' 모델…"멀티샷 기능 영화수준 품질 구현"



알리바바 로고. FILE PHOTO: China International Fair for Trade in Services, in Beijing ⓒ 로이터=뉴스1

알리바바 로고. FILE PHOTO: China International Fair for Trade in Services, in Beijing ⓒ 로이터=뉴스1


(서울=뉴스1) 김민석 기자 = 알리바바는 비주얼 생성 인공지능(AI) 모델 '완'(Wan)의 최신 버전 '완 2.6'(Wan 2.6) 시리즈를 공개했다고 17일 밝혔다.

완 2.6 시리즈는 이용자가 자신의 외형과 음성을 반영해 AI가 만든 영상 속 주인공으로 등장할 수 있도록 지원한다. 텍스트 프롬프트만으로 다중 장면을 설계하고 스토리텔링을 확장할 수 있다.

알리바바 관계자는 "Wan 2.6-R2V 경우 중국 최초의 '참조 기반 영상 생성'(reference-to-video) 모델"이라며 "이용자가 인물의 모습과 목소리가 담긴 짧은 참조 영상을 업로드하면 동일한 캐릭터가 새 장면 속에서 자연스럽게 등장하는 영상을 생성한다"고 말했다.

알리바바는 완 2.6 시리즈에 멀티모달(다중모드) 참조 생성 기술을 적용했다. 시각·청각 정보를 동시에 분석해 음성·표정·움직임을 정교하게 재현하는 기술을 통해 숏폼 드라마나 개인 영상 제작자의 창작 과정 효율을 높일 수 있다.

알리바바는 Wan 2.6 시리즈를 통해 △텍스트-영상 생성(T2V) △이미지-영상 생성(I2V) △이미지 생성(image·T2I) 모델 전반의 시각적 일관성을 높였다.

여러 장면을 하나의 연속된 이야기처럼 구성해 주는 '멀티샷(multi-shot) 스토리텔링' 기능도 추가했다. 영상 생성 길이는 최대 15초다.


Wan 2.6 시리즈는 알리바바 클라우드 AI 개발 플랫폼 '모델스튜디오'(Model Studio)와 완 공식 웹사이트를 통해 이용할 수 있다. 알리바바의 통합 AI 앱 '큐원'(Qwen)에 연동할 예정이다.

알리바바 관계자는 "프롬프트 해석 정확도와 시각 품질이 크게 개선돼 영화 수준의 콘텐츠를 제작할 수 있다"며 "예술적 스타일 조정과 사실적 초상화 생성 능력도 강화됐다"고 했다.

ideaed@news1.kr

Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지. <용어설명> ■ 멀티모달 멀티모달(Multimodal)은 멀티(Multi·복수)와 모달(Modal·형태)을 결합한 용어로 서로 다른 여러 형태의 데이터를 동시에 처리하고 이해하는 기술이나 방식을 의미한다.