"9.90과 9.11 중 어느 숫자가 더 클까"…AI 챗봇의 답은?

디지털투데이 원문
입력

2024.07.19 11:00

주소복사가 완료되었습니다

[AI리포터]

중국의 AI 챗봇이 기초 수학에 어려움을 겪자 우려가 제기되고 있다. [사진: 셔터스톡]

<이미지를 클릭하시면 크게 보실 수 있습니다>

[디지털투데이 AI리포터] 중국 내에서 공개적으로 사용 가능한 AI 챗봇의 등장으로 새로운 콘텐츠 생성이 증가하고 있다. 하지만 이 AI 챗봇은 기본적인 수학적 지식에는 어려움을 겪고 있는 것으로 알려졌다.

18일(현지시간) 홍콩 사우스차이나모닝포스트(SCMP)는 중국 리얼리티 쇼 'Singer 2024'에서 AI 모델이 기본적인 수학 문제 풀이에 어려움을 겪는다는 사실이 입증됐다고 전했다.

중국 가수 선난은 온라인 투표에서 13.8%를 득표해 상대 가수 샹테 무어를 제치고 우승했다. 이를 두고 일부 현지 네티즌은 투표 결과에 대해 AI에게 다시 물어보는 것이 어떠냐고 추천했고 그 결과, AI가 숫자 부분에 취약함을 알게 된 것.

대규모언어모델(LLM)은 광범위한 데이터 세트를 사용하여 인식, 요약, 번역, 예측 및 콘텐츠 생성이 가능한 딥러닝 AI 알고리즘이다. 중국에서 AI 챗봇이 확산됨에 따라 현지에서는 챗GPT와 같은 생성형 AI 서비스의 기초인 LLM이 200개 이상 개발됐다고 알려졌다.

항저우 제주앙 대학의 컴퓨터 과학 연구원인 우 이쿠안은 "LLM은 수학에 약하다. 이는 매우 흔한 일"이라고 말했다. 우에 따르면, 생성형 AI는 본질적으로 수학적 능력을 갖고 있지 않으며 훈련 데이터를 기반으로 답을 예측할 뿐이라고 한다.

그 일례로 9.9 또는 9.11 중 어느 숫자가 더 큰지 물었을 때, 오픈AI의 GPT-4o, 클로드 3.5 소네트, 미스트랄 AI와 같은 고급 LLM은 9.11이라고 답했다. AI의 프롬프트 엔지니어 라일리 굿사이드는 "우리는 여러 작업 영역에서 이러한 문제가 계속 발생할 것에 대비해야 한다"고 조언했다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

11.28 (목)

"9.90과 9.11 중 어느 숫자가 더 클까"…AI 챗봇의 답은?

디지털투데이 주요 뉴스