<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 인공지능(AI)의 생성 데이터 사용이 장기적으로 부작용을 초래할 수 있다는 연구 결과가 나왔다고 9일(현지시간) 온라인 매체 기가진이 전했다.
미국 텍사스주 라이스대 디지털 신호 처리 그룹이 AI가 생성한 데이터를 사용하면 미래에 심각한 부작용이 발생할 수 있다는 연구 결과를 발표했다. 이는 AI가 스스로 생성한 데이터로 학습하는 '자기 소비 훈련'을 반복하면 출력 결과의 품질과 다양성이 점차 감소하는 현상, 즉 '모델 자기 소비 장애'(Model Autophagy Disorder, MAD) 때문이다.
연구팀은 이를 검증하기 위해 세 가지 패턴의 훈련을 진행했는데, 새로운 실제 데이터를 얻지 못하는 두 가지 패턴에서 모델 출력이 점차 왜곡되어 출력 결과에서 품질과 다양성이 사라지는 것을 확인했다.
또 연구팀은 이전 세대의 AI 출력 결과에서 자체 소비 훈련용 고품질 데이터를 선택하는 '체리피킹' 실험을 재현했다. 체리피킹을 통해 고품질 결과를 우선적으로 포함하는 데이터셋으로 학습을 거듭한 AI는 오랜 세대에 걸쳐 양질의 데이터가 유지되었지만, 다양성이 많이 사라진 것을 확인할 수 있었다.
연구팀은 "MAD가 여러 세대에 걸쳐 통제되지 않은 채 방치된다면 인터넷 전체의 데이터 품질과 다양성이 훼손될 수 있다"며 "이로 인해 가까운 미래에 예기치 못한 결과가 의도치 않게 발생할 수 있다"고 경고했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.