<이미지를 클릭하시면 크게 보실 수 있습니다> |
중국 인공지능(AI) 스타트업 딥시크(DeepSeek·深度求索)는 AI 반도체 업계에 큰 질문을 던졌습니다. "반도체에 꼭 막대한 투자를 해야지만 파운데이션 모델을 구축할 수 있나." 딥시크가 개발해 작년 12월 선보인 딥시크-V3 모델은 오픈AI의 챗GPT에 버금갈 만한 성능을 보여줬지만, 비용은 80억원(557만달러)에 불과했는데요. 이를 기반으로 이달 선보인 경량화 모델 딥시크-R 시리즈는 더 큰 충격을 던졌습니다. 테스트 결과, 성능은 오픈AI 추론 모델인 o1에 버금가지만 추론 비용이 고작 4분의 1에 그쳤기 때문입니다.
이에 힘입어 딥시크는 지난달 27일 애플 앱스토어 무료 앱 다운로드 순위에서 오픈AI 챗GPT를 2위로 끌어내리고 1위에 오르며 기염을 토했습니다. "데이터센터에 수천억 원을 투입해야지만 고성능 AI를 개발할 수 있다"는 AI업계의 믿음을 송두리째 흔든 순간이었습니다.
퀀트 헤지펀드 운용하다 AI에 눈을 뜨다
량원펑은 이러한 경험을 토대로 2023년 5월 딥시크를 창업했고 세상을 놀라게 할 수 있는 AI 모델을 잇달아 발표했습니다. 특히 지난달에는 무료 앱 1위라는 타이틀을 얻었습니다. 이는 반도체 업계에 충격이었습니다. 지난달 27일 엔비디아 주가는 무려 16.97% 폭락했는데요. 이를 놓고 반도체 업계에서는 중국이 제한된 컴퓨팅 자원을 활용하는 기술을 고도로 발전시킨 것 아니냐고 해석합니다. 앤절라 장 미국 서던캘리포니아대(USC) 교수는 파이낸셜타임스를 통해 "중국의 효율성 증가는 우연이 아니다"며 "미국과 동맹국들이 부과한 점점 강화되는 수출 제한에 대한 직접적인 대응"이라고 설명했습니다.
딥시크는 V3 모델을 개발하는 데 개발비 약 80억원, 총 279만시간 분량의 H800 GPU를 사용했다고 밝혔습니다. 물론 논쟁은 있습니다. 개발비에 데이터센터 구축 비용이 포함된 것인지, 아니면 순수 AI 학습 비용만 고려한 것인지 알 수 없습니다. 하지만 분명한 것은 '가성비 끝판왕'이라는 점입니다. 100만토큰당 애플리케이션 프로그래밍 인터페이스(API)를 불과 0.28달러에 제공하기 때문입니다. 오픈AI가 10달러인 점을 고려할 때 무려 30분의 1 수준으로 그야말로 덤핑 판매입니다.
타임스는 이를 두고 "과거 냉전 시기 소련 과학자들이 제한된 컴퓨팅 환경에서 효율적인 프로그래밍을 통해 성과를 낸 것과 유사하다"고 평가했습니다. 딥시크가 가성비 모델을 내놓을 수 있는 배경은 무엇일까요.
크게 세 가지입니다. 일반적으로 AI 학습은 대량의 텍스트 데이터를 수집해 모델을 훈련시키는 사전 학습→특정한 용도에 맞게 모델을 추가 훈련하는 미세 조정→사람이 직접 AI 모델의 출력을 평가하고, 좋은 응답과 나쁜 응답을 구분하는 인간 피드백 기반 강화 학습(RLHF) 순입니다. 딥시크는 인건비를 최대한 낮추고자 자동 평가 시스템을 통해 RLHF를 최소화한 것으로 알려졌습니다.
마지막으로는 컴퓨터 양자화(Quantization)가 있습니다. AI 모델이 데이터를 처리할 때 사용하는 숫자의 정밀도를 낮추는 방식입니다. 일반적인 AI 모델은 32비트 부동소수점(FP32) 데이터를 사용해 연산을 수행합니다. 하지만 8비트 정수(INT8) 연산을 활용하면 계산량이 줄어들고 속도가 빨라집니다. 다만 세밀한 표현 능력이 떨어질 수 있는데, 범위 재조정 등을 통해 성능 저하를 막는 것이 기술력입니다.
AI 분야 '스푸트니크 모멘트' 가능성
딥시크가 쏘아 올린 '가성비 AI' 신호탄은 반도체 업계를 흔들었습니다. AI 시대에 반도체 기업이 주목받은 것은 고성능 AI를 구축하려면 막대한 컴퓨팅 자원이 필요하다는 믿음이 있었기 때문입니다. 현재 반도체에 대한 전망은 엇갈리고 있습니다. 브라이언 제이컵슨 애넥스웰스매니지먼트 수석 이코노미스트는 "만약 딥시크가 더 나은 AI 모델을 만들어 낸 것이 사실이라면 AI 산업 전체의 내러티브를 뒤흔들 수 있다"면서 "반도체 칩 수요를 감소시키고, 데이터센터 및 전력 인프라 확장의 필요성을 줄일 가능성이 있다"고 염려했습니다.
미래는 알 수 없지만, 한 가지 분명한 것은 있습니다. 딥시크가 데이터센터용 반도체 시장을 위축시킬 순 있지만, 모바일이나 PC용 반도체 시장을 더 크게 성장시킬 수 있다는 점입니다. 챗GPT가 서버에서만 실행되는 것과 달리, 딥시크 R1 모델은 오픈소스로 개방됐습니다. 기업들이 API 연결이 아닌 해당 모델을 내려받아 맞춤형 AI를 직접 개발할 수 있다는 뜻입니다. 딥시크 R1을 활용해 로컬 AI 서비스를 구축하는 기업이 늘어날 가능성이 큽니다.
대니얼 모건 시노부스 트러스트 포트폴리오 매니저는 "딥시크의 AI 모델은 데이터센터가 아닌 모바일·PC용"이라면서 "데이터센터용 AI 칩 시장과는 직접적인 관계가 없다"고 잘라 말했습니다. 경량화 버전을 내려받아 구동하기 위해선 최소 엔비디아 지포스 RTX 3090 칩이 장착된 PC가 있으면 가능한 것으로 알려졌습니다. 사실 GPU 업계는 작년부터 온디바이스 AI 시장으로 눈을 돌린 상태입니다.
엔비디아가 지난달 30일 종전 모델보다 성능을 15% 향상한 최신 그래픽 카드인 지포스 RTX 5080을 999달러(약 144만원)에 내놓은 것이 대표적입니다. 미국 온라인 커뮤니티 레딧에는 한 PC 전문 매장 앞에 해당 칩을 선점하기 위해 텐트를 치고 대기 중인 사진이 올라올 정도였습니다. 품절될 경우 값이 폭등할 것에 대비해 날밤을 새운 것입니다.
온디바이스 AI 시대에 뜰 GDDR 메모리
온디바이스 AI 칩을 내놓는 곳은 엔비디아뿐만이 아닙니다. 인텔은 아크 B580·B570 GPU를 선보였고, AMD는 RX 9070을 1분기에 선보일 예정입니다. 이러한 PC용 AI 칩에는 HBM이 아닌 GDDR(Graphics Double Data Rate)이 필수입니다. 데이터센터나 AI 가속기와 같은 전문 분야의 고성능 GPU에 사용되는데 HBM은 값이 비쌉니다. 적합하지 않은 이유입니다. 이 때문에 엔비디아 RTX50 시리즈에는 삼성전자 SK하이닉스 마이크론의 GDDR7이 탑재된 것으로 알려졌습니다.
HBM3는 3D 적층형 메모리로 공정이 복잡한 대신 대역폭은 초당 3.9TB에 달합니다. 반면 GDDR7은 공정이 복잡하진 않지만 대역폭이 초당 1.5TB 수준입니다. 그 대신 HBM 평균판매가격(ASP)은 14.3달러인 데 반해, GDDR7은 절반 이하 가격인 것으로 알려졌습니다.
GDDR은 1998년 마이크론이 처음 만들었는데요. 종전 DDR SDRAM이 3D 그래픽과 고속 연산을 처리하기에는 성능이 부족했기 때문에 개발됐습니다. 특히 1990년대 후반부터 3D 그래픽, 고해상도 영상, 게임, CAD(컴퓨터 지원 설계) 등 분야가 빠르게 발전하면서 주목받았습니다. 이후 삼성전자와 SK하이닉스가 합세했고 현재는 7세대까지 개발된 상태입니다. 핵심 개발 목표는 더 높은 대역폭, 저전력 소비, 고속 데이터 전송, 저지연성입니다.
현재 메모리 업계는 GDDR 경쟁이 한창입니다. SK하이닉스는 작년 7월 2GB 용량 GDDR7을, 삼성전자는 작년 10월 3GB 용량 GDDR7을 각각 출시했습니다. 김재준 삼성전자 메모리사업부 부사장은 지난해 4분기 실적 콘퍼런스 콜을 통해 성장을 담당할 4가지 반도체로 HBM·DDR5·GDDR7·서버 SSD를 꼽았습니다. 전망도 밝습니다.
시장조사업체 데이터인텔로에 따르면 세계 GDDR 메모리 시장 규모는 2023년 약 58억달러(8조3700억원)에서 2032년에는 약 126억달러(18조1800억원)로 성장할 전망입니다. 현재 메모리 업계는 전송 속도를 두고 경쟁 중입니다. 삼성전자와 SK하이닉스는 2월 미국 샌프란시스코에서 열리는 반도체 회로 분야 최고 권위 학술대회인 ISSCC에서 최고 전송 속도를 달성할 차세대 GDDR7을 내놓을 것으로 기대를 모으고 있습니다. 아직 딥시크 충격이 가시지 않고 있는데요. 하지만, 위기는 곧 기회이기도 합니다.
패권을 놓고 벌이는 '칩 워(Chip War)'를 파헤칩니다. 반도체 산업에서 펼쳐지는 뜨거운 소식을 독자분들이 알기 쉽게 정리해 드리는 심층 분석 연재물입니다(종전 연재물 '위클리 반도체'가 2025년 1월 24일부터 'AI&칩 워'로 코너명이 변경됐습니다).
[이상덕 기자]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.