컨텐츠 바로가기

03.01 (토)

화웨이 "중국산 GPU에서 딥시크-R1 추론 지원"

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]

(사진=셔터스톡)

<이미지를 클릭하시면 크게 보실 수 있습니다>


화웨이가 '모델아츠 스튜디오(ModelArts Studio)' 플랫폼을 통해 '딥시크-R1' AI 모델을 무료로 제공한다고 발표했다. 이 모델은 화웨이의 '어센드(Ascend)' 데이터센터 GPU에 최적화됐다고 밝혔는데, 이를 통해 화웨이 AI 칩이 R1 추론 작업에 사용됐을 가능성이 제기되고 있다.

톰스하드웨어는 30일(현지시간) 화웨이의 '어센드 910C' GPU가 딥시크 R1의 추론에 사용됐을 가능성을 제기했다. 딥시크 R1 모델은 2000개 이상의 엔비디아 'H800' GPU로 훈련됐다고 알려졌지만, R1를 실행하여 추론 작업을 지원하는 것은 화웨이의 어센드 GPU라는 내용이다.

화웨이는 모델아츠 스튜디오에서 어떤 종류의 어센드 GPU를 사용하는지 구체적으로 밝히지는 않았다. 그러나, AI 전문가 유첸 진은 "최신 어센드 910C GPU일 가능성이 있다"라고 말했다.

910C는 지난해 9월 샘플이 고객들에게 제공됐으며, 이미 화웨이 클라우드 서버에 탑재됐을 것으로 추정된다.

진은 "화웨이 910C의 추론 성능은 'H100' 성능의 60%에 달한다"라고 밝혔다. 또 R1 이 공식적으로 H800 칩으로 훈련됐지만, 딥시크가 추론에도 이를 사용한다는 것을 의미하지는 않는다고 설명했다.

R1이 미국 경쟁사들보다 적은 비용으로 비슷한 성과를 낸 데에는 이처럼 화웨이의 기술력이 배경이라는 분석이 나오고 있다. 미국은 딥시크가 엔비디아의 고급 GPU인 H100을 밀수했을 가능성도 제기하고 있지만, 중국의 반도체 기술 발전이 원동력이라는 해석도 힘을 얻고 있다.

다리오 알렉산더 분석가는 딥시크가 H800으로 훈련한 뒤, 910C에서 추론을 실행할 것으로 예측했다. 중국 정부는 자국 대기업들이 엔비디아 GPU 대신 화웨이의 어센드 GPU를 사용하도록 촉구하고 있으며, 특히 향후 급성장할 것으로 예상되는 추론 시장에서 비용 절감을 목표로 하고 있다.

AI용 반도체는 학습과 추론 과정에 따라 용도가 나뉘는 분위기로, 최근에는 추론에 특화된 반도체들이 많이 등장하고 있다.

화웨이가 개발한 어센드 시리즈는 H100과 비슷한 성능을 제공하면서도 가격 경쟁력이 높아, 중국 시장에서 엔비디아를 위협하고 있다.

또 화웨이는 7나노(㎚) 공정 기반으로 AI 칩을 개발, 중국의 SMIC와 협력해 양산을 진행하고 있다. AI 추론 작업에 최적화된 칩 개발에도 속도를 내고 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.