컨텐츠 바로가기

12.28 (토)

"6개월 뒤 성능 50% 향상된 2세대 '블랙웰' 칩 출시...추론에 초점"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]
AI타임스

블랙웰 GPU (사진=엔비디아)

<이미지를 클릭하시면 크게 보실 수 있습니다>


설계 상 문제로 블랙웰 'B200' GPU의 대량 생산이 예상보다 늦어질 수 있다는 우려에도 불구, 2세대 블랙웰 'B300' GPU의 출시 일정은 계획대로 진행될 것이라는 예측이 등장했다.

세미어낼리시스는 26일(현지시간) B300 GPU가 B200 출시 후 약 6개월 뒤에 출시될 예정이라고 전했다. B200과 GB200 모델은 현재 출시됐기 때문에, B300 시리즈는 2~3분기 중 출시될 것으로 예상된다.

이런 일정은 엔비디아가 차세대 제품의 출시를 예정보다 앞당기고 있다는 점을 나타내며, 그간 설계 문제로 발열 문제가 발생한 B200과 GB200에서 대량 생산 시점이 늦어질 가능성에 대한 우려를 불식시키려는 의도로 보인다.

B300 GPU의 주요 차별화 요소 중 하나는 메모리 용량이다. 이전 모델이 8단 'HBM3E' 메모리를 사용한 것에 비해 B300은 12단 HBM3E 메모리를 채택해 GPU당 288GB의 메모리 용량과 초당 8TB의 대역폭을 제공한다.

이를 통해 AI 모델 훈련과 추론 속도가 크게 향상하고, 특히 추론 비용이 최대 3배까지 절감될 것으로 기대된다. 이는 엔비디아의 추격자들이 추론에 초점을 맞춘 AI 칩을 잇달아 내놓는 데 따른 것이다.

또 B300은 더 큰 배치 크기를 처리하고, 확장된 시퀀스 길이를 지원하며, 사용자 인터랙션의 지연 문제를 해결하는 데 도움을 줄 수 있다.

메모리 용량 증가뿐만 아니라 전력 소모 측면에서도 중요한 변화를 겪을 예정이다. B300은 B200과 동일한 TSMC의 4나노(nm) 공정으로 제조되지만, 연산 성능이 50% 향상하며, 그에 따른 열 설계 전력(TDP)는 1400W로 B200보다 200W가 추가된다. 이 추가적인 200W로 성능이 50% 증가할 것으로 예상된다.

또 엔비디아의 '800G ConnectX-8' 네트워크 인터페이스 카드(NIC)를 채택할 가능성도 있다. 이는 기존 '400G ConnectX-7'보다 두배 더 높은 대역폭을 제공하며, PCIe 레인 수도 48로 늘어나 대규모 클러스터 운영에 중요한 장점이 될 것으로 보인다.

마지막으로, 엔비디아는 B200과 GB200 모델과 비교해 B300과 GB300의 공급망 방식을 대폭 변경할 예정이다. 이제 엔비디아는 전체 서버나 마더보드를 판매하는 대신, B300을 SXM 퍼크 모듈에 장착해 판매하고, 그레이스 CPU와 악시아도의 호스트 관리 컨트롤러(HMC)를 함께 제공할 계획이다. 이를 통해 더 많은 회사들이 블랙웰 시스템에 참여할 수 있게 되어, 블랙웰 기반 시스템의 사용이 확산될 것으로 전망된다.

B300과 GB300을 통해 엔비디아는 하이퍼스케일러 및 OEM 파트너들에게 블랙웰 시스템 설계에서 더 큰 자유를 부여할 계획이다. 이로 인해 가격과 성능이 달라질 수 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.