오픈AI [사진: 셔터스톡] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 인공지능(AI) 기업들이 고품질 학습 데이터 수집에 어려움을 겪고 있는 가운데, 오픈AI가 대규모언어모델 GPT-4 학습을 위해 100만시간 이상의 유튜브 동영상을 수집한 것으로 드러났다고 6일(현지시간) IT매체 더버지가 전했다.
오픈AI는 GPT-4를 학습시키기 위해 100만시간 이상의 유튜브 동영상을 전사하는 오디오 전사 모델 '위스퍼'(Whisper)를 개발한 것으로 알려졌다. 이는 법적으로 문제가 될 수 있으나, 오픈AI는 이를 공정한 사용이라고 주장했다.
관련해 유튜브 모회사인 구글은 오픈AI의 활동에 대해 확인되지 않은 보고를 받았다며, 유튜브 콘텐츠의 무단 스크랩이나 다운로드를 금지하고 있다고 밝혔다.
아울러 이러한 무단 사용을 방지하기 위해 명확한 법적 또는 기술적 근거가 있을 시 조치를 취할 것이라 전했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.