알리바바, 아이폰용 '큐원3' 출시..중국 아이폰에 AI 탑재 예고 : zum 뉴스

[박찬 기자]

(사진=셔터스톡)

알리바바가 아이폰에서 사용할 수 있는 온디바이스 인공지능(AI) 모델을 출시했다. 중국용 아이폰에 애플 인텔리전스 탑재가 임박했다는 신호다.

알리바바는 16일(현지시간) 애플의 머신러닝 프레임워크인 'MLX'에 최적화된 인공지능(AI) 모델 '큐원3(Qwen3)'를 출시했다고 발표했다. 이로써 아이폰, 아이패드, 맥북, 맥 등 중국용 애플 기기 전반에서 AI 기능을 네이티브로 실행할 수 있게 됐다.

이는 '애플 인텔리전스(Apple Intelligence)'의 중국 출시를 위해 애플과 협업한 결과다.

큐원3는 데이터를 해외 서버로 전송하지 않고 기기 내에서 직접 작동할 수 있어, 중국 정부의 엄격한 데이터 보안과 관련 규제에 적합하다.

애플의 뉴럴 엔진과 MLX 프레임워크에 최적화돼, 연산 자원 사용을 최대 90%까지 줄이면서도 강력한 AI 성능을 유지한다는 설명이다.

이를 통해 구글의 '제미나이'나 메타의 '라마3' 등 경쟁 모델 대비 30~40% 수준의 비용 절감 효과를 얻을 수 있다. 또 애플의 머신러닝 프레임워크인 MLX-LM은 오픈 소스 플랫폼 허깅페이스와 완전히 통합, 애플 실리콘 사용자들이 4400개 이상의 대형언어모델(LLM)을 클라우드 의존 없이 로컬에서 실행할 수 있게 됐다.

또 추론 모드와 비추론 모드를 자유롭게 오가는 하이브리드 시스템을 채택했다. 사용자는 최대 3만8000 토큰까지 '사고 지속 시간'을 설정할 수 있어, 지능적 성능과 연산 효율성 간의 균형을 세밀하게 조절할 수 있다. 이는 오픈AI의 'o3'와 비슷하게 모델이 스스로 정보를 검증할 수 있는 방식으로, 정교한 AI 작업에 적합하다.

특히 두가지 아키텍처 변형을 제공한다. 모든 매개변수를 항상 활성화하는 일반적인 '덴스(Dense)' 모델은 예측 가능한 성능과 저지연 처리에 적합하며 배포가 간단하다는 장점이 있다.

반면, 전문가 혼합(MoE) 모델은 입력에 따라 일부 전문가만 활성화하는 구조로, 토큰당 5~10%의 매개변수만을 사용하면서도 최대 2350억 매개변수까지 확장이 가능하다. 이는 특히 의료 추론, 코드 생성 등 전문적인 도메인에서 탁월한 효율을 제공한다.

MoE 구조는 동일한 규모의 덴스 모델 대비 네트워크 통신량이 약 50% 적어, 이기종 환경에서의 추론에도 유리하다. 이 방식은 복잡한 AI 작업을 효율적으로 처리할 수 있는 대안이다.

알리바바는 지난 2월 애플과의 협업을 발표한 바 있다. 이후 4개월이 지난 뒤 맞춤형 모델이 등장한 셈이다. 이에 따라 중국 아이폰에도 애플 인텔리전스 출시가 유력해졌다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>

이 기사의 카테고리는 언론사의 분류를 따릅니다.