[AI리포터]
[디지털투데이 AI리포터] 중국 인공지능(AI) 스타트업 딥시크가 긴 텍스트 처리 한계를 극복할 기술로 주목받았지만, 최근 연구에서 '딥시크-OCR(DeepSeek-OCR)'의 성능이 과장됐다는 지적이 나왔다고 20일(현지시간) 홍콩 사우스차이나모닝포스트(SMCP)가 전했다.
도호쿠대와 중국과학원 연구진은 딥시크-OCR이 시각적 인식이 아닌, 인공지능(AI) 모델이 기존 언어 패턴을 학습한 '언어 사전'에 의존한다고 분석했다. 이에 따라 딥시크가 발표한 성능 지표가 실제보다 부풀려졌다는 결론을 내렸다. 연구진은 AI가 긴 문서를 처리할 때 발생하는 '롱 컨텍스트 병목 현상'을 해결하는 것이 필수적이라고 강조했다.
딥시크-OCR은 시각적 압축을 통해 긴 텍스트를 줄이는 방식으로 개발됐으나, 연구진의 실험 결과 시각적 질문 응답 정확도가 20%대로 떨어졌다. 기존 AI 모델이 90% 이상의 정확도를 보이는 것과 대비된다. 이에 따라 현 기술이 AI의 긴 문서 처리 한계를 극복할 수 있는지에 대한 의문이 제기됐다.
딥시크는 현재까지 공식적인 반응을 내놓지 않았지만, 일부 전문가들은 이 기술이 근본적인 결함이 아닌 특정 상황에서 한계를 보이는 것이라고 평가했다. 중국과학기술대 출신 리보제 박사는 "시각적으로 불분명한 문서에서는 도움이 될 수 있지만, 명확한 텍스트에서는 오히려 불리하다"고 분석했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
AI의 긴 텍스트 처리 문제는 여전히 해결되지 않은 과제다. [사진: 셔터스톡] |
[디지털투데이 AI리포터] 중국 인공지능(AI) 스타트업 딥시크가 긴 텍스트 처리 한계를 극복할 기술로 주목받았지만, 최근 연구에서 '딥시크-OCR(DeepSeek-OCR)'의 성능이 과장됐다는 지적이 나왔다고 20일(현지시간) 홍콩 사우스차이나모닝포스트(SMCP)가 전했다.
도호쿠대와 중국과학원 연구진은 딥시크-OCR이 시각적 인식이 아닌, 인공지능(AI) 모델이 기존 언어 패턴을 학습한 '언어 사전'에 의존한다고 분석했다. 이에 따라 딥시크가 발표한 성능 지표가 실제보다 부풀려졌다는 결론을 내렸다. 연구진은 AI가 긴 문서를 처리할 때 발생하는 '롱 컨텍스트 병목 현상'을 해결하는 것이 필수적이라고 강조했다.
딥시크-OCR은 시각적 압축을 통해 긴 텍스트를 줄이는 방식으로 개발됐으나, 연구진의 실험 결과 시각적 질문 응답 정확도가 20%대로 떨어졌다. 기존 AI 모델이 90% 이상의 정확도를 보이는 것과 대비된다. 이에 따라 현 기술이 AI의 긴 문서 처리 한계를 극복할 수 있는지에 대한 의문이 제기됐다.
딥시크는 현재까지 공식적인 반응을 내놓지 않았지만, 일부 전문가들은 이 기술이 근본적인 결함이 아닌 특정 상황에서 한계를 보이는 것이라고 평가했다. 중국과학기술대 출신 리보제 박사는 "시각적으로 불분명한 문서에서는 도움이 될 수 있지만, 명확한 텍스트에서는 오히려 불리하다"고 분석했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
