컨텐츠 바로가기

11.29 (금)

이슈 인공지능 시대가 열린다

오픈AI 차기작 'o2', 벤치마크 점수 105% 달성…기존 2배

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[AI리포터]
디지털투데이

<이미지를 클릭하시면 크게 보실 수 있습니다>


[디지털투데이 AI리포터] 샘 알트먼 오픈AI 최고경영자(CEO)는 엑스(트위터)에서 "o2가 GPQA에서 105%의 점수를 달성했다"고 밝혔다. 해당 게시물 업로드 직후 알트먼은 "계정을 실수했다"는 글을 올렸다.

3일(현지시간) 온라인 매체 기가진은 o2가 무엇인지는 알려지지 않았으나, 오픈AI가 개발 중인 차세대 AI 모델이 엄청난 성능을 갖췄을 가능성이 높다고 전했다.

GPQA는 AI의 성능을 측정하는 벤치마크의 일종으로, 생물학·물리학·화학 전문가가 작성한 448문의 선택형 문제로 구성돼 있다. GPQA의 난이도는 상당히 높아 '비전문가'가 구글 검색을 통해 도전한 경우 34%, '박사학위 소지자 또는 박사학위 취득을 목표로 하는 학생'의 경우 65%의 정답률을 보였다.

GPQA는 이미 각종 고성능 AI의 벤치마크로 활용되고 있으며, GPT-4o는 53.6%, 클로드3 오푸스는 50.4%, 라마3 400b는 48.0%의 점수를 획득한 바 있다. 샘 알트먼이 언급한 '105%'라는 수치는 기존 AI의 점수를 크게 상회하는 것으로, o2라는 AI 모델이 박사학위 소지자를 능가하는 답변 능력을 갖췄음을 시사하고 있다.

알트먼이 언급한 o2는 GPT-4o나 오픈AI o1의 후속 모델로 추측할 수 있다. o2의 출시 시기는 알 수 없지만, 최근 알트먼은 "오는 2025년 중 여러 제품을 출시할 예정"이라고 언급한 바 있다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.