컨텐츠 바로가기

02.15 (토)

챗GPT와 딥시크에 수능 국어·수학 풀게 해봤더니…승자는?

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다


중국 스타트업 딥시크가 전 세계 AI 시장에 돌풍을 일으키고 있는 가운데, 재미있는 실험을 해봤습니다.

미국 오픈 AI사가 만든 챗GPT o1과 딥시크 AI 모델 R1에 각각 2025년 대입 수능 국어·수학 공통과목을 풀게 했습니다.

승자는 누구일까.

국어와 수학 두 과목 모두 챗GPT 오답이 딥시크보다 더 적어, 승자는 챗GPT로 가려졌습니다.

다만 두 모델 모두 수능 응시생들이 많이 틀린 문제를 주로 틀리는

유사성을 보이기도 했습니다.

[이상근/고려대 정보보호대학원 교수]

"재밌는 게 있는데요. 8번 같은 경우는 사람과 모든 AI가 다 틀렸고요."

두 모델이 가장 많이 틀린 국어 문제는 '가장 적절한 것' 혹은 '적절하지 않은 것'을 묻는 유형이었습니다.

[이상근/고려대 정보보호대학원 교수]

"'적절하지 않은'이면, 어쨌든 보기에 있는 그것과 반대로 한 번 생각을 해야 되는데 그런 것들이 좀 어렵지 않나."

흥미로운 점도 있었는데, 우리 시조를 다룬 국어 영역 문제에서 챗GPT는 오답을 냈지만 딥시크는 훌륭한 추론으로 정답을 맞혔습니다.

[이상근/고려대 정보보호대학원 교수]

"딥시크가 중국 또는 아시아 문화권에 있는 자료는 조금 더 많이 보지 않았을까."

최근 업그레이드된 챗GPT o3 미니 하이에도 같은 문제를 줬더니, 수학은 오답이 줄었지만 국어는 오답이 오히려 늘었습니다.

[이상근/고려대 정보보호대학원 교수]

"수학이나 코딩 능력을 강화하기 위해서 코딩 데이터를 더 많이 보게 되면 언어 능력이 약화될 수도 있는..."

수능 풀이 만으로 성능을 단언하긴 어렵지만, 가성비를 앞세운 딥시크가 전 세계 AI 시장에 큰 화두를 던진 것만은 확실해 보입니다.

[이상근/고려대 정보보호대학원 교수]

"굉장히 성능이 놀랄 정도로 많이 따라왔다, 중국 모델이. 특히 이걸 오픈 소스로 공개를 했기 때문에..."

정아람 기자

JTBC의 모든 콘텐트(기사)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.

Copyright by JTBC All Rights Reserved.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.