[딥시크 쇼크] 미중 AI 전면전...트럼프 '묻고 더블로 가'

뉴스핌 원문
입력

2025.01.31 17:32

최종수정

2025.01.31 17:34

주소복사가 완료되었습니다

[서울=뉴스핌] 최원진 기자= 중국의 생성형 인공지능(AI) 스타트업 '딥시크'(DeepSeek)가 미국의 반도체 수출 통제를 뚫고 오픈AI의 '챗GPT'를 능가하는 AI 모델을 내놓은 사실이 뒤늦게 알려지면서 전 세계가 발칵 뒤집혔다.

지난 20일(현지시간) 딥시크의 AI 추론형 모델 'R1'이 세상에 나왔을 때 도널드 트럼프 미국 대통령의 취임과 하루 뒤(21일) 오픈AI, 오라클, 일본 소프트뱅크의 합작사 '스타게이트'(Stargate)의 대규모 미국 AI 인프라 프로젝트 '스타게이트 프로젝트' 발표에 묻혀 큰 관심을 끌지 못했다.

그러다 이 스타트업이 지난해 12월 공개한 R1의 이전 대규모 언어모델(LLM)인 'V3'가 언어·수학·코딩 등 22개 벤치마크 테스트 중 13개 부문에서 오픈AI의 가장 강력한 모델인 'GPT-4o', 페이스북 모회사 메타플랫폼(이하 메타)의 AI 모델인 '라마 3.1' 등 경쟁 모델을 제치고 가장 뛰어났단 기술보고서를 내면서 AI업계에 지각변동이 일었다.

딥시크 일러스트. [사진=로이터 뉴스핌]

<이미지를 클릭하시면 크게 보실 수 있습니다>

더 충격적인 내용은 LLM 구축에 들어간 시간은 단 2개월, 개발에 든 비용은 겨우 560만 달러(약 81억 3740만 원)라는 것. 오픈AI의 챗GPT 개발에 들어간 비용(1억 달러)과 비교하면 5.6%에 불과하다.

첨단 AI 반도체를 탑재한 것도 아니다. 딥시크 V3 모델에는 엔비디아의 대(對)중 수출용 저사양 칩 'H800' 2048개가 사용된 것으로 알려졌다.

미국이 중국을 견제하고 AI 최강국 지위를 확립하기 위해 첨단 반도체 및 장비 수출 통제, 대중 기술 투자 제한 등 장장 지난 5년간 기울인 노력이 하루 아침에 물거품이 된 순간이다.

딥시크는 앱 스토어 무료 앱 다운로드 순위에서 챗GPT를 누르고 1위에 오르는 기염을 토했다. 뉴욕증시에서 엔비디아 주식이 하루 새 17% 급락하는 등 반도체와 AI 관련 진영이 일제히 몸살을 앓았다.

◆ 딥시크는 어떻게 해냈을까

딥시크가 어떻게 미국의 강력한 제재를 뚫고 고성능 AI 모델을 개발할 수 있었는지는 여전히 미스터리다. 회사는 엔비디아가 미국의 수출 통제를 우회해 중국에 수출할 수 있도록 기존 'H100' 칩에서 사양을 낮춘 'H800'으로 모델을 개발했다고 주장하는데, 업계 관계자들은 저성능 반도체로 고사양 AI모델을 그것도 단기간 안에 개발에 성공했단 신화를 믿기 어렵다는 분위기다. 딥시크가 이전에 첨단 반도체를 대량 확보해놓은 게 아니냐는 의혹이 뒤따른다.

딥시크가 중국 화웨이와 SMIC가 손잡고 구형 장비로 만든 AI 반도체 '어센드'(Ascend)를 대량 사용한게 아니냐는 추측도 나온다. 이 제품은 2022년 미국의 수출 통제에 대응해 개발된 것으로 2023년 출시의 '어센드 910B'의 경우 성능 효율은 엔비디아의 'A100'의 80% 수준이면서 가격은 30%에 불과한 것으로 알려졌다.

개발비는 또 왜 이렇게 저렴하느냐에 대해선 우선 딥시크 모델의 '전문가 혼합'(Mixture of Experts, MoE) 아키텍처란 효율적 구동 방식이 꼽힌다. MoE는 특정 분야의 여러 전문가가 모여 각자 작업을 수행하듯, 작업의 종류에 따라 특정 작업에 특화된 LLM만 활성화하는 기술이다.

딥시크 구동 화면. [사진=로이터 뉴스핌]

<이미지를 클릭하시면 크게 보실 수 있습니다>

회사의 기술보고서에 따르면 V3와 R1 모델 모두 각각 6710억 개의 파라미터(parameter·매개변수)를 갖는데 작업 시엔 이 중 340억개만 선별적으로 활성화하도록 설계됐다. 기존 방식보다 메모리 사용량이 훨씬 낮고 작업속도도 빠르다.

딥시크가 MoE란 효율적 메커니즘의 모델을 단기간 안에 출시한 것을 두고 오픈AI는 딥시크가 자사의 데이터를 도용했기 때문에 가능하다고 보고 마이크로소프트(MS)와 자체 조사에 착수했다. 실제로 그간 중국 기반의 기관들이 자사의 AI도구에서 대량의 데이터를 빼내려고 시도한 정황을 목격했다는 것. 이는 업계에서 '증류'(distillation)라고 부르는 과정을 통해 딥시크가 자사 모델을 훈련하기 위한 목적으로 보인단 주장이다.

증류는 쉽게 말해 기존에 나온 강력한 AI모델로 현재 개발 단계의 AI 모델의 출력값 품질을 검사해 결과적으로 우수한 기존의 AI모델 데이터를 효과적으로 전송받는 기술이다. 이는 챗GPT 등 빅테크 AI가 오픈소스여서 가능한 일종의 '모방은 혁신의 어머니' 격 꼼수다.

미국 빅테크들이 기초 모델 개발에 천문학적 투자를 해 선두주자로 자리잡았다면, 딥시크와 같은 후발 주자들이 이보다 훨씬 적은 비용으로 AI 경쟁에 나설 수 있게 됐단 진단이 나온다. 전문가들은 딥시크의 진짜 성능이 기존 빅테크들 모델보다 뛰어난지가 문제가 아니라고 말한다. 앞으로 제2, 제3 딥시크가 나오는 것은 시간문제라고 말한다.

◆ "스푸트니크 순간" 美中 'AI 냉전' 막 올랐다

미국의 AI 인프라 스타트업 애니스케일(Anyscale)의 공동 창업자 로버트 니시하라는 IT매체 테크크런치에 "(빅테크의) AI 연구소들이 지금 당장 작전실(war room)을 뒀다 해도 놀라지 않을 것"이라고 말했다. 그만큼 딥시크의 역습이 미국 기술 기업들에 크나큰 위협으로 인식되고 있단 전언이다.

실리콘밸리 대표 벤처캐피털(VC) 앤드리슨호로위츠(a16z)를 이끄는 마크 앤드리슨은 딥시크의 추론 모델 'R1'의 등장이 "스푸트니크 순간"이라고 평가했다. 1957년 소련이 쏘아 올린 세계 최초 인공위성 스푸트니크 1호에 비유한 것이다.

트럼프 대통령도 딥시크 출시가 미국 기업들에 "경종이 될 것"이라며 "경쟁에서 승리하기 위해 초집중할 필요가 있다"라며 중국과 본격 관세전쟁을 치르기 전 AI 패권 전쟁의 서막을 알렸다.

30일(현지시간) 백악관 집무실에서 기자들에게 말하는 도널드 트럼프 미국 대통령의 모습. [사진=로이터 뉴스핌]

<이미지를 클릭하시면 크게 보실 수 있습니다>

미국 상무부 장관으로 발탁된 하워드 러트닉도 최근 상원 인준 청문회에서 "우리가 (AI) 선두를 유지하기 위해 규제를 엄격히 추구하고 시행할 것"이라고 약속했다.

미국이 이 이상 어떤 조치를 취할지는 미지수다. 월스트리트저널(WSJ)이 취재한 트럼프 대통령 측 소식통들에 따르면 백악관 내에선 대중 반도체 및 기술 수출·투자 통제를 강화해야한단 목소리와 이제 제재만으론 중국의 기술 개발을 막기 어려우니 미국 기업이 압도적인 속도로 AI 개발 선두주자로 남게끔 지원하는 쪽에 초점을 맞춰야 한다는 제언 두 가지로 나뉘는 분위기다.

업계 전문가들은 트럼프 대통령이 중국을 더욱 옥죄는 전략을 고집할 것 같다고 말한다. 기업들에 수출 통제 대상 칩 제품에는 위치를 추적할 수 있는 기능을 추가할 것을 요구하는 등 수출통제 허점을 메우고 이를 어기는 기업에는 엄청난 패널티를 주는 등 더 강력해진 '중국 때리기'를 시도할 것이란 관측이다.

머케이터 중국연구소의 레베카 알체사티 선임 과학기술 연구원은 "미국 정부가 기존에는 개별 기업과 특정 국가 안보 위험에 대해 대응해 왔다면 이제는 중국 기술 생태계 전체가 특정 역량을 개발할 수 없도록 대응해 나갈 거 같다"고 내다봤다.

wonjc6@newspim.com

저작권자(c) 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

AI 이슈 트렌드

03.02 (일)

[딥시크 쇼크] 미중 AI 전면전...트럼프 '묻고 더블로 가'

뉴스핌 주요 뉴스