컨텐츠로 건너뛰기
검색
디지털데일리 언론사 이미지

"초대형 AI, 100만개 GPU 연결해야"…AMD “페산도 폴라라·UEC 1.0 공개" [AMD AAI 2025]

디지털데일리 새너제이(미국)=김문기 기자
원문보기

"초대형 AI, 100만개 GPU 연결해야"…AMD “페산도 폴라라·UEC 1.0 공개" [AMD AAI 2025]

서울맑음 / 27.0 °

[디지털데일리 김문기 기자] “백 개, 천 개가 아니라 이제는 백만 개 GPU를 연결할 수 있어야 한다.”

포레스트 노로드(Forrest Norrod) AMD 데이터센터 솔루션 총괄 수석 부사장은 12일(현지시간) 미국 새너제이 컨벤션 센터에서 개최된 'AMD 어드밴싱 AI 2025(advancing AI 2025, AAAI 2025)’에서 초대형 AI 인프라 확장을 위한 UEC(Ultra Ethernet Consortium) 1.0 표준의 공식 발표와 AMD 페산도 폴라라(Pensando Polara) 400 NIC 전략을 공개했다.

노로드 부사장은 “AI의 진화는 이제 단순한 모델 훈련을 넘어, 기가와트 스케일의 에이전틱(agentic) 컴퓨팅 인프라를 요구한다”며, 기존 이더넷이나 인피니밴드만으로는 해결할 수 없는 문제에 정면 대응해야 할 시점임을 강조했다.

그는 “UEC는 단순한 이더넷이 아니다"라며, "이더넷 위에 새롭게 정의된 전송 계층(transport layer)을 통해, AI 데이터센터 전역에서 효율적인 공유 메모리 패브릭을 구현할 수 있게 된다"고 말했다.

UEC 1.0은 AMD를 포함한 업계 주요 기업들이 주도한 표준으로, 기존 인피니밴드 대비 유례없는 확장성, 낮은 지연시간, 강력한 신뢰성을 제공한다. 이날 공식 발표된 1.0 버전은 발표 전날 정식 승인을 받아 공개됐다.


AMD는 이를 가장 먼저 지원하는 네트워크 인터페이스 카드(NIC) 제품군도 함께 소개했다. 폴라라(Polara) 400은 지난해 공개된 3세대 페산도(Pensando) P4 엔진 기반으로 고성능 프론트엔드 네트워크를 위해 설계되었으나, AI 백엔드에 최적화된 유연성과 성능을 갖췄다.

노로드 부사장은 “폴라라(Polara) 400은 UEC 1.0뿐만 아니라 여러 오픈 및 커스텀 트랜스포트 스택을 동시에 지원한다”며, NIC가 제공하는 고효율성과 낮은 복잡도, 높은 신뢰성이 AI 인프라를 실질적으로 변화시키고 있다고 설명했다. 실제로 AMD는 폴라라 400이 네트워크 비용을 최대 22% 절감하고, 시스템 복원력은 10% 이상 향상시켰다는 내부 데이터를 제시하기도 했다.


그는 “에이전틱 AI는 더 이상 개념이 아니다. 이미 현실로 등장하고 있다”고 단언하며, 이를 뒷받침할 엔드투엔드 AI 플랫폼을 제시했다.

셀레나 400 DPU와 5세대 에픽 CPU, 인스팅트 MI350 시리즈, 페산도 폴라라 NIC, UEC 기반 네트워크 등으로 AI 플랫폼을 구성할 수 있다. 이 모든 구성은 OCP(Open Compute Project) 기반 오픈랙 설계에 맞춰 통합된다.

노로드 부사장은 “락인 없는 개방형 인프라”를 추구한다며, “오픈이 제대로 작동할 때, 우리는 진정한 선택권과 혁신을 얻게 된다. AMD는 그 길을 주도하고 있다"고 말했다.

마지막으로 그는 “AI를 위한 인프라는 단순한 연산을 넘어, 네트워크 전체가 AI를 위해 설계돼야 한다”며, AMD의 포괄적인 AI 전략과 함께 산업 전반의 개방형 협력 생태계를 촉구했다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -