컨텐츠 바로가기

12.23 (월)

오픈AI, ‘GPT-5’ 개발 한계 도달?....“데이터 부족으로 개발 지연”

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
학습에 필요한 고품질 데이터 부족
새로운 데이터 직접 만들기로...시간·비용 부담 커져
인재 유출도 이러한 부담 키우고 있어


이투데이

샘 올트먼 오픈AI 최고경영자(CEO). AFP연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>


챗GPT 개발사 오픈AI가 차세대 인공지능(AI) 모델 개발에 주력하고 있으나 벽에 부딪혀 당초 목표보다 훨씬 지연되고 있다는 관측이 제기됐다.

22일(현지시간) 월스트리트저널(WSJ)은 복수의 소식통을 인용해 오픈AI가 코드명 ‘오리온(Orion)’으로 알려진 차세대 AI 모델 ‘GPT-5’ 개발을 18개월 넘게 진행 중이지만 일정이 기약 없이 지연되고 있으며 막대한 비용을 쓰고 있다고 보도했다.

당초 오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반께 새 모델이 나올 것으로 기대했지만, 대규모 훈련을 할 때마다 새로운 문제가 발생해 이러한 기대에 부응하지 못하는 결과가 나왔다고 WSJ는 전했다. 오픈AI는 18개월이 넘는 개발 기간 중 많은 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행한 것으로 전해진다.

소식통은 “오리온은 기존 제품보다는 성능이 개선되긴 했지만, 새로운 모델을 운영하는 데 드는 막대한 비용을 정당화할 만큼의 수준은 아니다”라고 짚었다. 업계 추정치에 따르면 이 정도의 대규모 AI 훈련에는 6개월간 컴퓨팅 비용만으로 약 5억 달러(약 7247억 원)가 소요될 수 있다.

실제로 샘 올트먼 오픈AI 최고경영자(CEO)는 20일 고급 추론 AI 모델 ‘o3’를 공개하면서도 GPT-5라고 부를 만한 새 주력 모델이 언제 나올지에 대해서는 언급하지 않았다.

오픈AI는 AI 챗봇 시대를 열며 지속적으로 AI 성능 개선을 구현해 시장에 충격파를 줬다. 비상장 회사인 오픈AI가 10월 1570억 달러의 기업가치를 인정받아 펀딩에 성공한 것은 GPT-5를 비롯한 차세대 모델에 대한 기대감이 반영된 결과다.

당초 시장에서는 GPT-5가 새로운 과학적 발견 과정을 도와주고, 일정이나 항공편 예약과 같은 일상적인 업무를 대신해줄 것으로 기대했다. 오픈AI 임원 출신인 한 소식통은 GPT-4가 똑똑한 고등학생이라면, GPT-5는 일부 작업에서는 박사 수준을 보일 것이라고 언급하기도 했다.

그러나 GPT-5 개발 계획은 사실 처음부터 문제가 있었다고 WSJ는 짚었다. 이전 모델의 경우 오픈AI는 인터넷에서 수집한 뉴스 기사나 소셜미디어 게시물, 과학 논문 등 양질의 데이터를 AI 훈련에 사용했다. 새 모델을 개발하는 과정에서는 더 지능적인 훈련에 필요한 데이터가 그만큼 충분하지 않았다. 즉 학습시킬 수 있는 고품질의 데이터가 한계에 도달했다는 것이다.

오픈AI는 이 문제를 해결하기 위해 새로운 데이터를 처음부터 직접 만들기로 하고, 오리온이 학습할 수 있도록 새로운 소프트웨어 코드를 작성하거나 수학 문제를 풀도록 해 AI가 이를 학습하게 하는 방식을 시도하고 있다. 하지만 이런 과정은 기존 방식보다 시간이 훨씬 더 많이 걸린다.

이런 가운데 경쟁업체에서 수백만 달러를 제시하며 최고 연구원을 빼가려는 시도도 문제 해결을 어렵게 만들고 있다고 WSJ은 전했다. 실제로 올해에만 20명 이상의 주요 임원과 연구원들이 회사를 떠났다.

올해 오픈AI를 떠난 공동 창립자인 일리야 수츠케버는 13일 한 강연에서 “데이터는 AI의 ‘화석연료’라고 말할 수 있는데, 최근 그 연료가 고갈되기 시작했다”면서 “우리가 가진 인터넷은 오직 하나뿐이어서 컴퓨터 연산 능력은 향상하고 있지만, 데이터는 늘지 않고 있다”고 설명했다.

AI 모델 개발이 한계에 부딪혔다고 우려하는 회사는 오픈AI만이 아니다. AI 모델의 성능 향상이 정체기를 맞은 것이 아니냐는 논쟁이 업계 전체에서 격화되고 있다고 WSJ는 전했다.

[이투데이/김나은 기자 (better68@etoday.co.kr)]

▶프리미엄 경제신문 이투데이 ▶비즈엔터

이투데이(www.etoday.co.kr), 무단전재 및 수집, 재배포금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.