"딥시크보다 똑똑한 최강 오픈소스 QwQ-32B 납신다."
홍콩 사우스차이나모닝포스트 등 외신들은 알리바바가 '딥시크-R1'과 오픈AI 'o1'을 능가하는 추론 모델을 오픈 소스로 출시했다고 전했다. 딥시크를 넘는 최강 오픈소스 모델이다.
알리바바는 6일 세계 최대 오픈소스 AI 모델 커뮤니티 '허깅페이스(Hugging Face)'를 통해 'QwQ-32B'를 오픈 소스로 출시했다. '아파치 2.0 라이선스'에 따라 연구는 물론, 상업적인 목적으로도 사용할 수 있다.
이 모델은 매개변수가 671억개인 R-1의 절반밖에 안 되는 320억개 규모지만, 성능은 뒤지지 않는다. 수학과 코딩에서만 R1에 근소하게 뒤졌을 뿐, 상식 등 3개 분야에서는 R1을 모두 앞섰다. 또 o1에는 지시 준수(IFEval)에서만 떨어졌을 뿐, 나머지 4개 분야에서는 모두 이겼다.
'QwQ-32B'는 강화 학습을 통해 최적화된 모델로서, 딥시크보다 20배 작은 훈련비용으로 최상위 성능을 달성했다.
'벤처비트'에서 AI 뉴스 및 루머 퍼블리셔인 처비(Chubby, @kimmonismus)는 "모델의 성능에 감명을 받았다. QwQ-32B가 20배 더 작음에도 불구하고 때때로 딥시크-R1보다 성능이 뛰어나다. 맙소사! Qwen이 요리했어!"고 썼다.
역시 같은 사이트에서 하이퍼발릭 랩스(Hyperbolic Labs)의 공동 창립자이자 CTO인 유천진(Yuchen Jin, @Yuchenj_UW)은 "출시를 축하한다. 작은 모델은 정말 강력하다. 딥시크 R1과 오픈AI를 능가하는 추론 모델이다"라고 평했다.
알리바바는 지난해 11월 처음으로 추론 모델인 'QwQ-프리뷰'를 출시하며 오픈AI에 도전장을 던졌다. 당시 'o1-프리뷰'나 'o1-미니'와 비슷한 성능을 달성했다.
12월에는 최초의 멀티모달 추론 모델 'QvQ-72B-프리뷰'를 출시했다. 또 지난달 26일에는 비디오 및 이미지 생성 AI 모델 '완 2.1(Wan 2.1)'을 오픈 소스로 공개, 인간 선호도 벤치마크인 IM아레나에서 동영상 모델 부분 1위에 올랐다.
또 1월 말에는 비추론 모델 '큐원 2.5 맥스(Qwen 2.5 Max)'를 통해 처음으로 '딥시크-V3'를 능가한다고 발표했다. 이를 기반으로 개발한 추론 모델 'QwQ-맥스(QwQ-Max)'도 프리뷰 버전으로 출시했다.
알리바바는 이처럼 최근 3개월 동안 최고 수준의 오픈 소스 모델 6개를 잇달아 출시했다. 특히 비추론과 추론 모델 두 분야에서 모두 딥시크 성능을 훌쩍 뛰어넘어섰다.
알리바바 창립자 마윈은 최근 시진핑을 만나 AI투자하기로 밝혔다. |
알리바바 AI 자체 모델 출시 소식에 주가는 6일 홍콩 증시에서 최대 8.2%까지 급등했다. 이는 2주 만에 가장 큰 상승폭이다.
알리바바는 최근 AI에 집중하고 있다. 시진핑을 직접 만난 창업자 마윈은 4년만에 업계로 복귀하면서 "앞으로 3년간 AI와 클라우드 컴퓨팅 인프라에 3800억 위안(약 520억달러), 한국돈으로 75조 이상을 투자하겠다"고 밝혔다.
<저작권자 Copyright ⓒ 게임톡 무단전재 및 재배포 금지>
