패러다임 전환·오픈소스에 호평…'스푸트니크 모멘트' 평가도
일각선 과대 마케팅…앤트로픽 CEO "비용감축 추세 속 예상결과"
중국의 오성홍기와 중국의 AI 업체 딥시크를 합성한 시각물. ⓒ 로이터=뉴스1 ⓒ News1 박형기 기자 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
(서울=뉴스1) 김민석 기자 = 딥시크(DeepSeek)가 개발한 LLM(거대언어모델) 기반 인공지능(AI) 모델을 두고 미국 빅테크 기업 경영진들이 엇갈린 평가를 내놓고 있다.
대체로 기술 패러다임 전환과 오픈소스 영향력 확대의 계기로 봤지만, 일각에선 과대평가일 수 있다고 지적했다.
샘 올트먼 X(옛 트위터) 갈무리 |
1일 IT 업계에 따르면 샘 올트먼 오픈AI 최고경영자(CEO)는 X(옛 트위터)에 "딥시크의 R1은 가격대비성능 면에서 인상적"이라며 "새로운 경쟁자가 등장한 것은 (AI 업계에) 활력을 불어넣는 일이다. 우리는 분명 더 나은 차세대 모델을 출시할 것"이라고 말했다.
마크 앤드리슨 a16z 창업자는 X를 통해 "AI 분야의 스푸트니크 모멘트(Sputnik Moment)"라고 평가했다.
스푸트니크 모멘트는 기술 우위를 자신하던 국가가 후발 주자의 앞선 기술에 충격을 받는 순간을 의미한다. 1957년 옛 소련이 최초의 위성 스푸트니크 1호를 미국보다 먼저 발사한 데서 유래했다.
모건 브라운 드롭박스 AI 부사장 |
모건 브라운 드롭박스 AI 부사장은 딥시크에 적용된 '멀티토큰 예측(MTP) 시스템'과 '전문가 혼합(MoE) 아키텍처' 등을 주목했다.
딥시크 LLM 모델 프로그래밍(딥시크 기술 논문 갈무리) |
MoE는 특정 작업을 요청하면 그에 특화한 LLM만 활성화하는 기술이다. 딥시크 기술 논문에 따르면 딥시크-R1의 파라 미터(매개변수)는 6710억 개지만, 작업에 따라 그중 340억 개만 선별적으로 활성화하도록 했다.
메타 경영진은 AI 조직의 막대한 비용 구조와 관련 재검토 압박을 받는 것으로 전해졌다. 외신에 따르면 메타는 딥시크를 분석하기 위해 AI 부서 내 '워룸'(war room) 4개를 설치하고 딥시크 모델 방식과 데이터 출처 등을 연구하고 있다.
다리오 아모데이 앤트로픽 CEO SWITZERLAND-DAVOS-POLITICS-ECONOMY-AI ⓒ AFP=뉴스1 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
반면 다리오 아모데이 앤트로픽 CEO는 딥시크의 단기 성과를 인정하면서도 장기적 경쟁력 면에선 회의적이라고 밝혔다.
그는 "딥시크 R1의 기술적 진보는 과대평가되고 있다"며 "성능은 자사 클루드(Claude) 3.5 소넷(Sonnet)에 뒤처져 있으며 총 개발 비용 역시 미국 AI 기업들과 크게 다르지 않을 것"이라고 말했다.
아모데이 CEO는 "딥시크는 획기적 성과라기보단 LLM 모델 개발 비용의 하향 추세 속에서 예상된 결과"라고 했다.
한편 딥시크-R1에 투입된 개발비는 550만 달러로 알려졌다. 오픈 AI가 챗GPT 개발에 쓴 비용 대비 18분의 1에 불과하다. 마이크로소프트(MS)와 오픈AI는 딥시크가 GPT-o1 등이 산출한 데이터를 무단으로 수집했을 가능성을 제기하며 조사에 나섰다. 미국 외 한국을 포함한 세계 각국에서도 보안 우려를 제기하며 견제에 나섰다.
딥시크-오픈AI AI 모델 개발 관련 밈 만화(글로벌 커뮤니티 갈무리) |
ideaed@news1.kr
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.