<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 인공지능(AI)을 홍보하는 마케팅에서는 '시각 기능'이나 '시각적 이해' 등과 같은 문구를 사용한다. 하지만 11일(현지시간) IT매체 테크크런치에 따르면 이러한 모델은 입력 데이터의 패턴을 학습 데이터의 패턴과 일치시키는 것이 전부이며, 사소해 보이는 다른 특정 작업에서 실패하는 것으로 나타났다.
오번대와 앨버타대로 구성된 연구팀은 AI 모델의 시각적 이해에 대한 연구를 수행했다. 이들은 가장 큰 멀티 모달(Multi Modal) 모델에게 두 개의 도형이 겹치는지, 그림에 오각형이 몇 개 있는지 등 매우 간단한 시각적 과제를 제시했는데, 이는 초등학교 1학년도 맞힐 수 있는 문제들이었다. 그러나 AI 모델은 이러한 문제들에 어려움을 겪는 것으로 나타났다.
연구팀은 AI 모델이 가지고 있는 '맹목성'에 대해 지적했다. AI 모델이 이미지에서 추출하는 시각적 정보는 근사적이고 추상적이라는 것. 이는 모델에는 시간적 판단을 내릴 수 있는 수단이 없기 때문에 이미지에 대한 정보는 있지만 실제로 볼 수 없는 사람의 반응과 비슷하다고 연구팀은 설명했다.
다만 이번 연구 결과는 '시각적' AI 모델이 쓸모없다는 것을 의미하지는 않는다. 이러한 모델은 사람의 행동과 표정, 일상적인 사물과 상황의 사진 등에 대해서는 매우 정확할 가능성이 높다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.