컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

엔비디아, 동영상·코딩 특화 차세대 추론 전용 칩 '루빈 CPX' 공개

AI타임스
원문보기

엔비디아, 동영상·코딩 특화 차세대 추론 전용 칩 '루빈 CPX' 공개

속보
이노스페이스 상업 발사체 한빛나노 세우고 추진제 충전
[박찬 기자]
(사진=엔비디아)

(사진=엔비디아)


엔비디아가 인공지능(AI) 추론 작업에 특화된 신형 GPU '루빈 CPX(Rubin CPX)'를 2026년 말 출시한다고 밝혔다. 이 칩은 방대한 데이터와 컨텍스트를 동시에 처리해야 하는 영상 생성이나 검색, 대규모 소프트웨어 개발, 코드 생성 등에 최적화된 것이 특징이다.

엔비디아는 9일(현지시간) 미국 산타클라라에서 열린 'AI 인프라 서밋'에서 이 같은 계획을 공개했다. 루빈 CPX는 내년에 등장할 차세대 아키텍처 루빈 기반으로 설계됐으며, 현 세대 '블랙웰'을 잇는 후속작이다.

현재 AI 추론은 하나의 GPU가 입력 이해부터 응답 생성까지 모두 담당하는 구조로, 효율성이 떨어진다는 지적이 있었다. 엔비디아는 루빈 CPX를 통해 이 과정을 분리·최적화해 더 높은 성능을 제공할 수 있다고 설명했다.

특히, 100만 토큰 이상의 긴 컨텍스트를 처리할 수 있어, 대규모 영상 분석이나 복잡한 코드 프로젝트에서도 활용도가 높다고 강조했다.

젠슨 황 CEO는 "RTX가 그래픽과 물리 AI에 혁명을 일으켰듯이, 루빈 CPX는 모델이 수백만개의 지식 토큰을 동시에 추론하는 대규모 컨텍스트 AI를 위해 특별히 설계된 최초의 CUDA GPU"라고 밝혔다. 또 커서와 런웨이, 파이어웍스, 투게더 같은 스타트업들이 이 칩을 활용할 계획이라고 전했다.

루빈 CPX는 영상 디코딩, 인코딩, 추론 과정을 단일 칩에서 통합 처리할 수 있다. 이에 따라 생성 AI의 영상 제작 속도가 빨라지고, 코드 작성도 단순한 제안 수준을 넘어 대규모 소프트웨어 프로젝트 이해와 실행으로 발전할 수 있다는 설명이다.


엔비디아는 "새 하드웨어에 1억달러를 투자할 경우 최대 50억달러의 매출을 창출할 수 있다"라며, 투자 대비 수익률을 부각했다.

현재 엔비디아 데이터센터 부문은 연간 1840억달러(약 255조원) 매출이 예상될 정도로 성장세를 보이고 있으며, 최근 분기 매출은 411억달러(약 57조원)에 달했다.

루빈 CPX의 출시는 구글과 아마존, 마이크로소프트, 그로크, 세레브라스 등 추론 전용 칩 시장에서 기회를 노려온 경쟁사들에게 타격이 될 전망이다.


오픈AI와 애플도 브로드컴과 함께 추론 칩 개발을 추진 중이지만, 엔비디아의 독주 체제를 흔들기는 쉽지 않을 것으로 보인다.

cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>