(사진=셔터스톡) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
마크 저커버그 메타 CEO가 데이터셋에 저작권 논란이 있다는 것을 알면서도 인공지능(AI) 모델 학습에 사용하도록 승인했다는 의혹이 제기됐다.
로이터는 9일(현지시간) 미국 캘리포니아 북부 지방 법원에 제출된 소송 문서를 인용, 저커버그 CEO가 불법 복제물이 대거 포함된 것으로 보이는 AI 학습 데이터셋 '립젠(LibGen)'을 AI 모델 훈련에 사용하도록 승인했다고 보도했다.
코미디언 사라 실버맨과 타네히시 코츠를 포함한 작가 그룹은 지난 2023년 메타가 대형언어모델(LLM) '라마'를 훈련하는 과정에서 자신의 저서를 무단으로 사용했다고 주장하며 고소했다. 메타 측은 공정 사용 원칙을 내세우며 이를 반박했다.
지난해에는 메타가 승소했다. 빈스 차브리아 캘리포니아 지방법원 판사는 메타의 AI가 생성한 텍스트가 저작권을 침해했다는 원고의 주장과 메타가 저작권 관리 정보(CMI)를 제거했다는 원고 측 주장을 기각했다. 이에 작가들은 법원에 수정된 소장을 제출할 수 있도록 요청했다.
이에 따라 새로 제출된 소송 문서에 따르면, 메타 내부 직원들은 립젠을 불법 복제된 데이터셋이라는 것을 알고 있었으며, 이 데이터셋을 사용하면 문제가 될 수 있다고 우려했다는 내용이 포함됐다.
작가들은 저커버그 CEO가 립젠을 AI 모델 학습에 사용하도록 승인했으며, 메타가 립젠 데이터에서 저작권 정보를 제거하는 스크립트를 작성했다는 주장도 제기했다. 이는 저작권 침해 사실을 숨기려는 시도로 해석될 수 있다.
원고 측은 새로운 증거가 저작권 침해 사실을 입증하며, CMI 소송을 되살리고 컴퓨터 사기 청구를 추가할 정당성을 제공한다고 강조했다.
차브리아 판사는 작가들이 수정된 소장을 제출하는 것을 허용했으나, 사기와 CMI 청구의 타당성에 대해선 여전히 회의적인 입장을 보인 것으로 알려졌다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.