컨텐츠로 건너뛰기
검색
AI타임스 언론사 이미지

바이두, 중국 최대 '2.4조' 매개변수 멀티모달 모델 공개

AI타임스
원문보기

바이두, 중국 최대 '2.4조' 매개변수 멀티모달 모델 공개

속보
뉴욕증시 하락 출발…다우 0.5% S&P 0.2%↓
[박찬 기자]
(사진=셔터스톡)

(사진=셔터스톡)


바이두가 중국 최대 규모인 매개변수 2조4000억개의 차세대 멀티모달 모델을 공개했다. 기존 중국 모델의 2배가 넘는 규모로, 이제는 미국 빅테크들과 정면 경쟁에 나선 것으로 볼 수 있다.

바이두는 22일(현지시간) '어니 5.0(ERNIE 5.0)'을 공개했다. 텍스트·이미지·오디오·비디오를 하나의 아키텍처로 통합 처리하는 '네이티브 옴니모달(Native Omni-modal)' 모델로, 바이두가 지금까지 선보인 모델 중 가장 진보한 파운데이션 모델로 평가된다.

이제까지 중국 모델 중 매개변수가 가장 큰 것은 문샷 AI의 '키미 K2'와 앤트 그룹의 '링-1T' 등의 1조개였다. 이를 바이두는 2배 이상 넘어버린 것이다.

이번 모델은 오픈 소스로 출시하지 않았다. 기술 보고서도 공개하지 않았다. 개인 사용자는 어니봇 웹사이트를 통해 서비스를 이용할 수 있고, 기업과 개발자는 바이두의 AI 플랫폼 첸판(Qianfan)을 통해 API 형태로 접근할 수 있다.

X와 짤막한 게시물을 통해 바이두 밝힌 바에 따르면, 어니 5.0의 가장 큰 특징은 초대형 전문가 혼합(MoE) 구조와 초희소 활성화(sparse activation)다.

특히 전체 매개변수 가운데 3% 미만인 700억개만 활성화하는 방식으로, 연산 비용과 지연 시간을 크게 줄이면서도 성능 저하를 최소화했다는 것이 두드러진다. 대규모 모델의 서비스 적용에서 가장 큰 과제로 꼽히는 효율성 문제를 해결했다고 강조했다.


바이두 부사장 우톈은 "대부분의 멀티모달 모델이 다른 모달을 나중에 결합하는 '후기 결합' 방식을 쓰지만, 어니 5.0은 통합 자기회귀(unified autoregressive) 아키텍처를 통해 멀티모달 데이터를 하나의 프레임워크에서 공동 학습한다"라며 "이를 통해 진정한 네이티브 풀모달 이해와 생성이 가능해졌다"라고 설명했다.

ERNIE 5.0 is officially live!

As a native omni-modal large model, it is built on end-to-end architecture to enable unified multimodal understanding and generation.


With a 2.4T-parameter MoE architecture and under 3% active parameters per inference, ERNIE 5.0 balances strong… pic.twitter.com/TMTDuDgQuD

— Baidu Inc. (@Baidu_Inc) January 22, 2026

공개한 벤치마크 결과에 따르면, 어니 5.0은 구글의 '제미나이 3 프로'와 오픈AI의 'GPT-5 하이', '딥시크-V3.2 싱킹' 등과 맞먹는 성능이다.


그러나 압도적인 성능을 보이지는 못했다. 여전히 제미나이 3 프로가 가장 앞선 것으로 나타났다.


지난 15일 공개된 LM아레나 텍스트 리더보드에서도 정식 버전 '어니-5.0-0110'은 중국 모델 1위, 글로벌 8위를 기록했다.

하지만, 바이두는 GPT-5.2 하이에 이어 수학 분야 세계 2위를 기록한 것을 강조했다. 또, 리더보드에 진입하자마자 중국 1위를 차지한 점은 모델 역량이 빠르게 고도화되고 있음을 보여준다고 자평했다.

바이두는 멀티모달 이해와 코딩, 창작 글쓰기에서 의미 있는 진전을 이뤘다고 밝혔다. 고전 소설 '홍루몽'의 문체를 모사하면서 동시에 현대 비즈니스 논리를 결합한 '대관원 자산 재편 계획'을 생성하는 사례를 통해, 맥락 이해와 창의적 생성 능력도 입증했다고 전했다.

또 이번 모델 개발에는 기술·금융·문화·교육·의료·에너지 등 다양한 산업과 수학·물리·문학·철학 등 학문 분야에서 835명의 전문가가 참여해, 논리적 엄밀성과 전문성, 창작 품질, 가치 정합성 검증에 기여했다고 덧붙였다.

한편, 이번 모델을 오픈 소스로 풀지 않은 점에 대해 전문가들은 바이두가 기술적 격차를 유지하고 기업용 매출을 극대화하려는 전략으로 해석하고 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>