컨텐츠 바로가기

01.03 (금)

인간 수준 AI에 한발 더···추론하는 AI모델 ‘o1’ 챗GPT에 탑재

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

■ 오픈AI, 오늘부터 GPT 유료모델 탑재

단계적 추론으로 문제 해결···느리지만 정확도 높아져

복잡한 공식과 코드 개발하는 과학자 및 개발자에 도움

AI 작동방식 확인할 수 있어···AGI 향한 중대한 단계 ?

서울경제

<이미지를 클릭하시면 크게 보실 수 있습니다>



챗GPT를 개발한 오픈AI가 인간과 같은 추론 능력을 갖춘 AI 모델 ‘o1’을 12일(현지 시간) 출시했다. 모델은 이날부터 챗GPT의 유료 버전에 통합된다.

오픈AI에 따르면 ‘o1’은 수학과 과학, 코딩에서 어려운 문제를 해결할 수 있는 추론 능력이 있다. o1은 오픈AI가 그동안 ‘스트로베리’라는 코드명으로 추론 능력에 초점을 두고 개발해온 모델이다. 회사의 수석 과학자 야쿱 파초키는 “챗GPT와 같은 이전 모델은 질문하는 즉시 응답을 시작하지만 이 모델은 시간이 걸릴 수 있다”며 “문제를 생각하고 분석하고 각도를 찾아 최선의 해답을 제시하는 모델”이라고 설명했다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 83%의 정답률을 기록해 이전 모델(GPT-4o)의 정답률인 13%를 크게 뛰어넘었다고 설명했다. 또 이 모델이 복잡한 수학 공식을 만드는 물리학자들이나 개발자, 다양한 실험을 하는 의료 연구자들을 지원하는데 도움이 될 것이라고 덧붙였다.

새로운 모델은 머신러닝 기법의 하나인 강화학습(반복적인 시행착오를 통한 학습)을 통해 문제 해결에 접근한다는 점에서 기존 GPT 모델과는 차이가 난다. 원하는 정보를 찾고 분석하는데 시간이 오래 걸리므로 GPT 모델보다 비용이 많이 들지만 응답이 더 일관되고 정교할 수 있다. 프로젝트 수석 연구원인 마크 첸은 “질문에 답하기 위해 시간을 들여 다양한 전략을 모색하게 되며, 실수를 했다는 것을 깨닫게 되면 바로 수정할 수 있다”고 짚었다. 뉴욕타임스(NYT) 역시 “챗GPT나 구글의 제미나이와 같은 AI 챗봇은 때때로 간단한 수학 문제를 푸는 데 어려움을 겪고, 버그가 많고 불완전한 경우가 많으며 때때로 (답을) 지어내기도 한다”며 “새 모델은 이런 결함을 완화할 수 있다”고 평가했다.

새로운 모델은 AI의 작동 방식을 이해하는데도 도움을 줄 전망이다. 회사의 CTO(최고기술책임자)인 미라 무라티는 파이낸셜타임스(FT)에 “우리는 모델의 사고에 대한 가시성을 확보할 수 있으며, AI의 사고 과정을 단계별로 관찰할 수 있을 것”이라고 말했다.

서울경제

<이미지를 클릭하시면 크게 보실 수 있습니다>



오픈AI의 새로운 모델 o1은 인간 수준의 AI인 범용인공지능(AGI)을 개발하기 위한 노력 중 하나로 풀이된다. FT는 “단계별 추론을 수행하고 미리 계획을 세우도록 가르치는 것은 인간과 같은 인지 능력을 갖춘 AGI를 개발하는데 중요한 이정표가 될 것”이라고 설명했다. 몬트리올대학의 컴퓨터 과학자 요슈아 벤지오에 따르면 이 분야에서는 GPT, 구글 제미나이, 앤트로픽의 클로드 등이 초기 추론 능력을 보여주면서 꾸준히 발전해왔다.

다만 이런 AI 시스템이 진정한 범용 추론의 능력은 아직 갖추지 못했다는 것이 과학자들의 합의다. 뉴욕대 인지과학 교수인 게리 마커스는 “우리는 과학계의 주의 깊고 인내심 있는 조사를 통해 추론에 대한 주장이 계속 무너지는 것을 보았기에 (o1의) 새로운 주장에 대해서도 회의적으로 바라볼 것”이라고 말했다. 오픈AI 최고경영자(CEO) 샘 올트먼 역시 이 모델에 대해 “범용의 복잡한 문제를 추론할 수 있는 AI”라고 말하면서도 “이 기술이 여전히 결함이 있고, 제한적”이라고 설명했다.

그럼에도 향후 수년간은 이 분야의 기술 경쟁이 AI의 발전을 이끌 것이라는 관측이 높다. AI 스타트업 코히어의 CEO 에이단 고메즈는 “AI 모델에 문제를 해결하도록 가르치면 기능이 ‘극적으로’ 향상되는 것을 볼 수 있다”고 짚었다.

김경미 기자 kmkim@sedaily.com
[ⓒ 서울경제, 무단 전재 및 재배포 금지]

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.