[박찬 기자]
구글이 유튜브에 올라온 방대한 동영상을 인공지능(AI) 모델 훈련에 활용하는 것으로 확인됐다.
CNBC는 19일(현지시간) 구글이 '제미나이(Gemini)'와 영상 생성 AI '비오 3(Veo 3)'를 훈련하기 위해 유튜브에 업로드된 동영상 라이브러리를 사용하고 있다고 보도했다.
유튜브에는 현재 약 200억개 이상의 영상이 등록되어 있으며, 이중 어느 정도가 AI 훈련에 사용되는지는 정확히 공개되지 않았다. 그러나 플랫폼 규모를 고려할 때 단 1%만 사용해도 23억분 분량의 데이터에 달하는 것으로 추정되며, 이는 경쟁 AI 모델들이 활용한 데이터보다 40배 이상 많다는 분석도 나온다.
![]() |
(사진=셔터스톡) |
구글이 유튜브에 올라온 방대한 동영상을 인공지능(AI) 모델 훈련에 활용하는 것으로 확인됐다.
CNBC는 19일(현지시간) 구글이 '제미나이(Gemini)'와 영상 생성 AI '비오 3(Veo 3)'를 훈련하기 위해 유튜브에 업로드된 동영상 라이브러리를 사용하고 있다고 보도했다.
유튜브에는 현재 약 200억개 이상의 영상이 등록되어 있으며, 이중 어느 정도가 AI 훈련에 사용되는지는 정확히 공개되지 않았다. 그러나 플랫폼 규모를 고려할 때 단 1%만 사용해도 23억분 분량의 데이터에 달하는 것으로 추정되며, 이는 경쟁 AI 모델들이 활용한 데이터보다 40배 이상 많다는 분석도 나온다.
유튜브 영상 활용이 주목받는 이유는 구글이 5월에 공개한 비오 3가 영화 수준의 시각·음향을 모두 생성할 수 있는 첨단 AI 비디오 생성기로 평가받고 있기 때문이다. 구글은 공개 당시, 노인이 배를 타는 장면이나 픽사 스타일의 동물이 대화를 나누는 장면 등 모든 영상과 음향이 AI로 생성된 샘플을 선보였다.
유튜브는 매일 2000만개의 영상이 독립 창작자와 주요 미디어 기업들에 의해 업로드되고 있으며, 이들 영상 대부분은 구글의 AI 학습에 활용될 수 있다. 이용자는 영상을 업로드할 때 유튜브에 "전 세계적이며 비독점적이고 로열티 없는 사용권"을 자동 부여하게 되며, 이를 통해 구글은 별도의 동의 없이도 AI 훈련에 해당 콘텐츠를 활용할 수 있다.
이에 따라 창작자와 미디어 기업들의 지식재산권 침해 우려가 커지고 있다는 지적이다. 전문가들은 구글이 명확한 고지 없이 사용자 콘텐츠를 AI 모델 훈련에 사용하는 것은 향후 지적재산권 분쟁으로 이어질 수 있다고 밝혔다.
다만, 구글은 비오 등 생성 AI 제품에 '면책 조항'을 포함, 사용자가 AI로 생성한 콘텐츠로 인해 저작권 침해 소송에 직면할 경우 법적 책임을 구글이 대신 지겠다는 입장을 밝혔다.
또 지난해 12월 미국 최대 연예 에이전시인 CAA(Creative Artists Agency)와 파트너십을 맺고, 유명인들이 자신과 닮은 AI 콘텐츠를 식별하고 관리할 수 있도록 지원하고 있다.
이밖에 창작자가 본인의 초상권 등을 침해한 AI 콘텐츠에 대해 삭제를 요청할 수 있는 도구도 제공 중이다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.