컨텐츠로 건너뛰기
검색
디지털데일리 언론사 이미지

MS도 탈 엔비디아 시동, 차세대 AI 추론 가속기 '마이아 200' 공개

디지털데일리 이상일 기자
원문보기

MS도 탈 엔비디아 시동, 차세대 AI 추론 가속기 '마이아 200' 공개

속보
靑 "관세합의 이행 의지 美에 전달하고 차분히 대응"

[디지털데일리 이상일기자] 마이크로소프트가 인공지능(AI) 추론 성능과 비용 효율을 개선한 자체 설계 가속기 ‘마이아(Maia) 200’을 공개했다. 이 칩은 3나노미터(nm) 공정 기반으로 제작된 추론 전용 프로세서로, 오픈AI의 최신 GPT-5.2 등 대규모 언어모델(LLM) 구동을 지원한다.

마이아 200은 1400억개 트랜지스터를 포함하며 FP8과 FP4 정밀도를 지원하는 텐서 코어, 7TB/s 대역폭의 216GB HBM3e 메모리, 272MB 온칩 SRAM을 탑재했다. 이를 통해 4비트 연산에서 10페타플롭스, 8비트 연산에서 5페타플롭스 이상의 성능을 제공한다. 마이크로소프트는 마이아 200이 기존 자체 하드웨어 대비 달러당 성능을 30% 향상시켰다고 밝혔다.

마이아 200은 이종 AI 인프라의 일부로, 마이크로소프트 파운드리(Foundry)와 마이크로소프트 365 코파일럿(Copilot) 등에서 비용 대비 성능 우위를 제공한다. 슈퍼인텔리전스 팀은 이 칩을 활용해 합성 데이터 생성과 강화 학습을 진행하고, 이를 통해 차세대 내부 모델을 고도화할 계획이다.

시스템 측면에서는 표준 이더넷 기반 2단계 확장 네트워크를 채택해 전용 패브릭 없이도 6144개 가속기 클러스터 간 안정적 성능을 제공한다. 또한 2세대 액체 냉각 열교환기(HEU)와 통합 제어 시스템을 적용해 전력 효율과 신뢰성을 높였다.

마이크로소프트는 마이아 200을 미국 아이오와주 디모인 인근 데이터센터에 우선 배치했으며, 이어 애리조나주 피닉스 지역으로 확대할 예정이다. 글로벌 인프라 전반으로의 확산도 예고했다.

개발자용 소프트웨어 개발 키트(SDK)도 함께 공개됐다. 마이아 SDK는 파이토치(PyTorch) 통합, 트라이톤(Triton) 컴파일러, 최적화된 커널 라이브러리, 저수준 프로그래밍 언어 접근 기능을 포함하며, 모델 최적화와 이식성을 개선할 수 있다.

마이크로소프트는 다세대 마이아 설계를 통해 향후 더 높은 성능과 효율성을 구현할 계획이라고 밝혔다. 현재 마이아 SDK 프리뷰 신청이 가능하며, 관련 자료와 영상은 공식 사이트에서 제공된다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -