AI가 출력한 데이터를 AI가 학습하면, 시스템이 붕괴한다?

디지털투데이 원문
입력

2024.08.09 16:04

주소복사가 완료되었습니다

[AI리포터]

<이미지를 클릭하시면 크게 보실 수 있습니다>

[디지털투데이 AI리포터] 인공지능(AI)의 생성 데이터 사용이 장기적으로 부작용을 초래할 수 있다는 연구 결과가 나왔다고 9일(현지시간) 온라인 매체 기가진이 전했다.

미국 텍사스주 라이스대 디지털 신호 처리 그룹이 AI가 생성한 데이터를 사용하면 미래에 심각한 부작용이 발생할 수 있다는 연구 결과를 발표했다. 이는 AI가 스스로 생성한 데이터로 학습하는 '자기 소비 훈련'을 반복하면 출력 결과의 품질과 다양성이 점차 감소하는 현상, 즉 '모델 자기 소비 장애'(Model Autophagy Disorder, MAD) 때문이다.

연구팀은 이를 검증하기 위해 세 가지 패턴의 훈련을 진행했는데, 새로운 실제 데이터를 얻지 못하는 두 가지 패턴에서 모델 출력이 점차 왜곡되어 출력 결과에서 품질과 다양성이 사라지는 것을 확인했다.

또 연구팀은 이전 세대의 AI 출력 결과에서 자체 소비 훈련용 고품질 데이터를 선택하는 '체리피킹' 실험을 재현했다. 체리피킹을 통해 고품질 결과를 우선적으로 포함하는 데이터셋으로 학습을 거듭한 AI는 오랜 세대에 걸쳐 양질의 데이터가 유지되었지만, 다양성이 많이 사라진 것을 확인할 수 있었다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

11.28 (목)

AI가 출력한 데이터를 AI가 학습하면, 시스템이 붕괴한다?

디지털투데이 주요 뉴스