오픈AI가 20일(현지시간) 최신 AI모델인 o3을 공개했다. <사진=오픈AI 채널> |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
오픈AI가 사고력이 뛰어난 인공지능(AI) 모델인 o1의 후속 모델인 o3(오쓰리)를 공개했다.
20일(현지시간) 오픈AI는 12일 간의 신규 서비스 공개 이벤트의 마지막날 9월 공개한 o1의 후속모델인 o3를 공개했다.
오픈AI에 따르면 o3는 다양한 벤치마크에서 뛰어난 성능을 기록했으며, 일반인공지능(AGI)에 근접한 성능을 냈다.
AI 시스템이 학습된 데이터 외부에서 새로운 기술을 효율적으로 습득할 수 있는지 평가하기 위해 고안된 테스트인 ARC-AGI에서 o3는 높은 컴퓨팅 설정에서 87.5%의 점수를 획득다. 최악의 상황(낮은 컴퓨팅 설정)에서는 o1의 3배에 달하는 성능을 보였다. 이는 최근 5년간 가장 뛰어난 성과다.
다만 높은 컴퓨팅 설정은 작업당 수천 달러에 달하는 엄청난 비용이 들었다고 ARC-AGI 공동창업자 프랑수아 콜레는 설명했다.
o3는 프로그래밍에 중점을 둔 벤치마크인 SWE-벤치 베리파이드(Bench Verified)에서 o1보다 22.8% 포인트 더 높은 성능을 보이며 코딩 능력의 또 다른 척도인 코드포스 등급에서 2727점을 기록했습니다.
o3는 2024년 미국 수학능력시험에서 단 한 문제만 틀린 채 96.7%를 획득하고 대학원 수준의 생물학, 물리학, 화학 문제들로 구성된 GPQA 다이아몬드에서 87.7%를 달성했습니다. o3는 EpochAI의 프론티어 수학 벤치마크에서 25.2%의 문제를 해결했다.
오픈AI는 소형모델인 o3미니도 공개했다. 비용을 낮추고 속도를 높인 모델이다. o1미니보다 4배 정도 빠르다.
o1의 후속모델이 o3가 된 것은 o2라는 이름의 영국 통신회사가 있기 때문으로 추정된다.
이번에 공개된 o3는 일반 공개 전으로 일부 사용자를 대상으로 프리뷰가 제공될 예정이다. 또한, AI 얼라인먼트와 안전 문제를 보강할 예정이다.
[실리콘밸리=이덕주 특파원]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.