<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 인공지능(AI) 개발 기업 미스트랄(Mistral)AI가 엔비디아와 협력해 '미스트랄 네모'(Mistral NeMo)를 개발했다고 19일(현지시간) 온라인 매체 기가진이 전했다.
미스트랄 네모는 다국어 지원 모델로 개발됐으며 특히 일본어와 영어, 중국어, 한국어, 아랍어, 이탈리아어, 스페인어, 독일어, 힌디어, 프랑스어, 포르투갈어에서 성능을 발휘한다.
또 컨텍스트 윈도우가 12만8000개로 구글의 젬마2(Gemma 2) 9B와 라마3(Llama 3) 8B보다 더 많은 프롬프트를 처리할 수 있다. 양자화를 고려하여 설계돼 FP8에서도 성능 저하 없이 추론 처리가 가능하다. 미스트랄 네모는 다국어 성능을 측정하는 대부분의 벤치마크 테스트에서 라마3 8B 모델을 능가하는 점수를 기록했다고 매체는 전했다.
미스트랄 네모는 새로 개발된 토큰나이저 '테큰'(Tekken)을 채택해 토큰화 효율을 높였다. 일본어는 기존 토큰나이저 대비 1.56배의 효율로 토큰화가 가능하며, 아랍어에서는 3.02배, 말레이시아어에서는 3.90배의 효율이 향상됐다.
미스트랄 네모는 엔비디아의 AI 플랫폼 DGX 클라우드에서 학습 처리를 실행하고 있으며, 학습 시에는 AI 개발 프레임워크 '미스트랄 네모'에 포함된 GPU 최적화 기술인 '메가트론(Megatron)-LM'을 활용했다고 한다. 미스트랄 네모는 이미 엔비디아 NIM에서 사용할 수 있는 서비스로 패키지화되어 있다.
기본 모델인 'Mistral-Nemo-Base-2407'과 미세 조정 버전인 'Mistral-Nemo-Instruct-2407'이 허깅 페이스(Hugging Face)에 공개돼 있다. 라이선스는 Apache License 2.0으로 상용 앱에도 사용 가능하다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.