컨텐츠로 건너뛰기
검색
게임톡 언론사 이미지

알리바바, "봤지? 딥시크-오픈AI 넘는 '최강 QwQ-32B' "

게임톡 박명기 기자
원문보기

알리바바, "봤지? 딥시크-오픈AI 넘는 '최강 QwQ-32B' "

서울맑음 / -3.9 °

"딥시크보다 똑똑한 최강 오픈소스 QwQ-32B 납신다."

홍콩 사우스차이나모닝포스트 등 외신들은 알리바바가 '딥시크-R1'과 오픈AI 'o1'을 능가하는 추론 모델을 오픈 소스로 출시했다고 전했다. 딥시크를 넘는 최강 오픈소스 모델이다.

알리바바는 6일 세계 최대 오픈소스 AI 모델 커뮤니티 '허깅페이스(Hugging Face)'를 통해 'QwQ-32B'를 오픈 소스로 출시했다. '아파치 2.0 라이선스'에 따라 연구는 물론, 상업적인 목적으로도 사용할 수 있다.

이 모델은 매개변수가 671억개인 R-1의 절반밖에 안 되는 320억개 규모지만, 성능은 뒤지지 않는다. 수학과 코딩에서만 R1에 근소하게 뒤졌을 뿐, 상식 등 3개 분야에서는 R1을 모두 앞섰다. 또 o1에는 지시 준수(IFEval)에서만 떨어졌을 뿐, 나머지 4개 분야에서는 모두 이겼다.

'QwQ-32B'는 강화 학습을 통해 최적화된 모델로서, 딥시크보다 20배 작은 훈련비용으로 최상위 성능을 달성했다.

'벤처비트'에서 AI 뉴스 및 루머 퍼블리셔인 처비(Chubby, @kimmonismus)는 "모델의 성능에 감명을 받았다. QwQ-32B가 20배 더 작음에도 불구하고 때때로 딥시크-R1보다 성능이 뛰어나다. 맙소사! Qwen이 요리했어!"고 썼다.


역시 같은 사이트에서 하이퍼발릭 랩스(Hyperbolic Labs)의 공동 창립자이자 CTO인 유천진(Yuchen Jin, @Yuchenj_UW)은 "출시를 축하한다. 작은 모델은 정말 강력하다. 딥시크 R1과 오픈AI를 능가하는 추론 모델이다"라고 평했다.

알리바바는 지난해 11월 처음으로 추론 모델인 'QwQ-프리뷰'를 출시하며 오픈AI에 도전장을 던졌다. 당시 'o1-프리뷰'나 'o1-미니'와 비슷한 성능을 달성했다.

12월에는 최초의 멀티모달 추론 모델 'QvQ-72B-프리뷰'를 출시했다. 또 지난달 26일에는 비디오 및 이미지 생성 AI 모델 '완 2.1(Wan 2.1)'을 오픈 소스로 공개, 인간 선호도 벤치마크인 IM아레나에서 동영상 모델 부분 1위에 올랐다.


또 1월 말에는 비추론 모델 '큐원 2.5 맥스(Qwen 2.5 Max)'를 통해 처음으로 '딥시크-V3'를 능가한다고 발표했다. 이를 기반으로 개발한 추론 모델 'QwQ-맥스(QwQ-Max)'도 프리뷰 버전으로 출시했다.

알리바바는 이처럼 최근 3개월 동안 최고 수준의 오픈 소스 모델 6개를 잇달아 출시했다. 특히 비추론과 추론 모델 두 분야에서 모두 딥시크 성능을 훌쩍 뛰어넘어섰다.

알리바바 창립자 마윈은 최근 시진핑을 만나 AI투자하기로 밝혔다.

알리바바 창립자 마윈은 최근 시진핑을 만나 AI투자하기로 밝혔다.


알리바바 AI 자체 모델 출시 소식에 주가는 6일 홍콩 증시에서 최대 8.2%까지 급등했다. 이는 2주 만에 가장 큰 상승폭이다.

알리바바는 최근 AI에 집중하고 있다. 시진핑을 직접 만난 창업자 마윈은 4년만에 업계로 복귀하면서 "앞으로 3년간 AI와 클라우드 컴퓨팅 인프라에 3800억 위안(약 520억달러), 한국돈으로 75조 이상을 투자하겠다"고 밝혔다.

<저작권자 Copyright ⓒ 게임톡 무단전재 및 재배포 금지>