<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 알리바바가 새로운 인공지능(AI) 모델 '큐웬2-VL'(Qwen2-VL)을 발표했다고 2일(현지시간) 온라인 매체 기가진이 전했다.
큐웬2-VL은 기존 모델 '큐웬-VL'(Qwen-VL)을 개편한 것으로, 여러 벤치마크에서 GPT-4보다 뛰어난 성능을 보였다고 한다. 특히 문서와 동영상을 이해하는 시각적 벤치마크 평가에서 높은 점수를 얻었으며, 스마트폰이나 로봇 등 다국어 지원 등의 기능이 추가됐다.
이어 가장 큰 모델인 큐웬2-VL-72B(Qwen2-VL-72B)은 복잡한 대학 수준의 문제 해결 및 수학 능력, 문서 및 표 이해, 다국어 텍스트 및 이미지 이해, 일반적인 시나리오의 질문 응답, 동영상 이해, '에이전트'로서의 응답 등 6개 지표에서 타사 주요 모델을 뛰어넘는 성능을 보였다.
이와 함께 모바일에 최적화된 큐웬2-VL-2B(Qwen2-VL-2B)모델도 출시됐다. 이 모델은 이미지, 동영상, 다국어 이해에서 높은 성능을 자랑한다. 특히 동영상 관련 작업, 문서 이해, 일반적인 시나리오의 질문 응답에서 다른 동급 모델과 비교했을 때 월등히 뛰어나다고 한다.
큐웬2-VL의 인식 능력을 보여주는 사례로는 숫자가 적힌 블록 사진을 제시해 각 블록의 색상과 숫자를 출력해 달라고 질문했을 때, 쿠웬2-VL은 정확하게 색상과 숫자를 출력했다고 매체는 전했다.
알리바바는 큐웬2-VL에 대해 "식물이나 랜드마크뿐만 아니라 장면 내 여러 물체 간의 복잡한 관계를 이해하는 뛰어난 물체 인식 능력을 갖추고 있다"라며 "이미지 내 필기체 및 다국어 인식 능력도 크게 향상되어 전 세계 사용자들이 더욱 쉽게 사용할 수 있다"라고 말했다.
Today we are thriiled to announce the release of Qwen2-VL! Specifically, we opensource Qwen2-Vl-2B and Qwen2-VL-7B under Apache 2.0 license, and we provide the API of our strongest Qwen2-VL-72B! To learn more about the models, feel free to visit our:
Blog:… pic.twitter.com/aBIDeQtWZY
— Qwen (@Alibaba_Qwen) August 29, 2024<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.