컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

최대 200배 빨라진 동영상 생성 기술 '터보디퓨전' 오픈 소스 공개

AI타임스
원문보기

최대 200배 빨라진 동영상 생성 기술 '터보디퓨전' 오픈 소스 공개

서울맑음 / -3.9 °
[박찬 기자]

품질 저하 없이 실시간에 가까운 속도로 AI 영상을 생성할 수 있는 핵심 기술이 오픈 소스로 공개됐다.

중국의 성서우 테크놀로지와 칭화대학교, UC버클리 연구진은 27일(현지시간) 기존 대비 최대 200배 빠른 속도로 고품질 AI 영상을 생성할 수 있는 영상 생성 가속 프레임워크 '터보디퓨전(TurboDiffusion)' 논문을 온라인 아카이브를 통해 공개했다.

터보디퓨전은 AI가 영상을 만드는 과정 전반을 효율적으로 바꿔, 생성 속도를 크게 높이는 기술이다. 모델이 아니라, 기존 '확산(diffusion)' 기반 영상 모델에 적용 가능한 추론 프레임워크다.

먼저 전체 데이터를 한꺼번에 처리하는 대신 중요한 정보에 집중하는 희소 선형 어텐션(Sparse Linear Attention)을 더 빠른 저비트 어텐션 가속(SageAttention)으로 바꿨다.

또 기존에는 100번에 달하던 영상 생성 단계를 3~4번만에 끝내도록 축소하는 스텝 증류(rCM) 기법을 적용해 시간을 대폭 단축했다.

여기에 모델의 수치 계산을 8비트(INT8)로 줄이는 양자화를 통해 모델 크기를 절반 정도로 줄이고, GPU의 INT8 텐서코어 연산 기능을 활용해 처리 속도도 끌어올렸다. 이를 통해 고해상도·장시간 영상에서도 시각적 안정성과 일관성을 유지할 수 있다는 설명이다.


완전한 오픈 소스로 깃허브에 공개됐으며, 모델 체크포인트와 학습·추론 코드를 즉시 활용할 수 있다. 'RTX 4090'과 같은 소비자용 GPU에서도 대형 모델을 구동할 수 있어, 'A100'이나 'H100' 같은 고가의 전문 GPU 의존도를 낮춘 점도 주목된다.


연구진은 알리바바의 오픈 소스 동영상 생성 모델 '완(Wan)' 제품 군을 테스트 대상으로 삼았다.

터보디퓨전을 적용하면, 소비자용 GPU인 엔비디아 'RTX 5090' 한장으로도 5초 분량의 480P 표준 화질(SD) 영상 생성 시간을 3분 이상에서 최대 1.9초로 단축했다. 이는 약 100배에 달하는 가속 효과다.


720P 고해상도(HD) 5초 영상도 80분 걸리던 생성 시간이 최대 24초로 줄어들며 최대 200배 속도 향상을 기록했다.

성서우는 지난 2024년 7월에도 30초 만에 4초 분량의 영상을 생성할 수 있다는 '비두(Vidu)' 모델을 출시한 바 있다. 이어 올해 1월에는 '비두 2.0'를 통해 생성 시간을 10초로 줄였다고 발표했다. 그리고 이번에는 1.9초까지 단축한 것이다.

단지, 공개된 수치는 최적의 테스트 환경에서 산출된 최단 시간이다. 실제 환경에서는 시간이 더 걸릴 수 있다.


TurboDiffusion: 100–205× faster video generation on a single RTX 5090

Only takes 1.8s to generate a high-quality 5-second video.

The key to both high speed and high quality?
SageAttention + Sparse-Linear Attention (SLA) + rCM

Github: https://t.co/ybbNBjgHFP

Technical… pic.twitter.com/6d6foxEQ9Z

— Jintao Zhang (@Jintao_Zhang_) December 15, 2025

TurboDiffusion is changing AI video generation speed.

A video that used to take 4,549 seconds to generate can now be done in ~39 seconds, with almost the same visual quality.

Developed by ShengShu Technology (Vidu AI) with Tsinghua University, TurboDiffusion is an open-source… pic.twitter.com/E45aYczSLt

— ACO (@ACO_labs) December 24, 2025

한편, 개발자들은 터보디퓨전으로 직접 생성한 영상을 X(트위터) 등에 올리며 놀랍다는 반응을 쏟아내고 있다. 특히, 일부는 "AI 비디오 분야의 '딥시크 모먼트'가 될 잠재력이 있다"라는 평가를 내놓았다.

또 AI 네이티브 파운데이션이라는 단체는 "터보디퓨전은 다양한 산업 분야에서 AI 비디오 제작을 위한 실시간 가능성을 열어준다"라며 "기업들은 비용을 절감하고 반복 작업을 가속화하여 상업적 규모의 비디오를 제작할 수 있을 것"이라고 밝혔다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>