알리바바가 최신 버전 LLM 큐원2를 공개했다. [사진: 알리바바 클라우드] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 중국 전자상거래 기업 알리바바가 새로운 오픈 소스 인공지능(AI) 모델 '큐원2'(Qwen2)를 공개했다.
지난 7일(현지시간) 홍콩 사우스차이나모닝포스트(SCMP)에 따르면 알리바바는 큐원2를 공개하며, 일부 성능이 메타의 라마3(Llama 3)을 능가한다고 주장했다.
큐원2의 모델 크기는 Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B, Qwen2-72B 등 다섯 가지다. 이들은 다국어 사전 훈련으로 영어와 중국어 외 27개 언어로 데이터를 추가 학습한 것이 특징이며 모델별로 49억개에서 최대 727억개의 파라미터를 갖고 있다고 알려졌다.
알리바바는 큐원2가 다국어 이해 역량뿐만 아니라 사후 학습을 통해 코딩이나 수학, 추론, 명령 수행 처리 능력 등을 개선했다고 밝혔다. 특히 사전학습 데이터셋과 최적화된 학습 방법을 활용해 Qwen2-72B는 라마3의 최신 모델보다 우수한 성능을 보였다는 설명이다.
작은 크기의 큐원2 모델들도 비슷하게 높은 수준을 보이며, 특히 코딩과 중국어 관련 지표에서 두각을 나타냈다고 한다.
이외에도 알리바바는 100만 토큰 문서 처리를 위한 효율적인 에이전트 솔루션도 오픈소스화해, 향후 새로운 모델을 위한 오픈소스 AI 발전을 가속화할 것이라는 입장이다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.