<이미지를 클릭하시면 크게 보실 수 있습니다> |
오픈AI가 고급 추론이 가능한 차세대 인공지능(AI) 모델 'o3'를 공개했다.
20일(현지시간) o3는 지난 9월 선보인 'o1'의 업그레이드 버전이다. 오픈AI는 소형 모델인 'o3 미니'도 함께 선보였다. 모델명에서 'o2'를 건너 뛴 건 영국 이동통신 브랜드 'O2'와의 상표권 분쟁 가능성을 염두했기 때문이다.
'o' 시리즈 모델은 'GPT'와 달리 응답 전에 먼저 시간을 들여 생각하고 답변을 하도록 설계됐다. 답변 전에 추론 과정을 설명하고, 그 중 가장 정확한 응답이라고 생각되는 내용을 요약해 보여준다.
'o3' 역시 응답에 수 초에서 수 분이 걸리지만, 물리, 과학, 수학 등 전문 분야에서 더 신뢰할 수 있는 답변을 내놓는다고 회사 측은 설명했다.
실제 'o3'는 2024년 미국 수학 올림피아드(AIME) 시험 문제에서 96.7%의 정답률을 기록했고, 대학원 수준의 생물학, 물리학, 화학 문제를 푸는 'GPQA 다이아몬드'에서는 87.7%를 달성했다.
오픈AI는 o3가 특정 조건에서 범용인공지능(AGI)에 근접하는 성능을 발휘한다고 설명했다. AI 시스템이 훈련된 데이터 외부에서 새로운 기술을 효율적으로 습득할 수 있는지 평가하도록 설계된 테스트인 'ARC-AGI'에서 o3는 87.5%의 점수를 달성했다.
또한 프로그래밍 작업 수준을 평가하는 벤치마크(SWE-Bench Verified)에서 'o1'보다 22.8% 포인트 높은 성능을 보였으며, 코딩 실력 측정 지표(Codeforces)에서는 2727점을 기록해 엔지니어 상위 99.2%에 해당하는 2400점을 뛰어넘었다.
'o3'에는 '추론 시간 조정' 기능이 새로 도입됐다. 이용자는 'o3'의 사고 시간을 낮음-중간-높음 중에 선택할 수 있다. 연산 시간이 길수록 성능은 더 좋다.
샘 알트먼 오픈AI 최고경영자(CEO)는 내년 1월 말 'o3 미니'를 먼저 출시하고 이어 'o3'를 내놓을 예정이다. 이날부터 일부 연구원들을 대상으로 미리보기 버전이 제공된다.
남도영 기자 hyun@techm.kr
<저작권자 Copyright ⓒ 테크M 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.