마이크로소프트가 소형언어모델 '파이-3-미니'를 출시했다. [사진: 허깅페이스] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 마이크로소프트(MS)가 소형언어모델 '파이-3-미니'(Phi-3-mini)를 출시했다고 23일(현지시간) IT매체 아스테크니카가 전했다.
파이-3-미니는 이전에 출시된 2개의 소형언어모델인 파이-2와 파이-1의 후속 버전이다. 오픈AI의 GPT-4 터보와 같은 기존의 대규모언어모델(LLM)보다 운영이 간단하고 비용이 저렴하며, 인터넷 연결 없이도 스마트폰에서 실행 가능한 것이 특징이다.
구글의 팜2(PaLM 2)와 대규모언어모델 중 일부는 수천억개의 매개변수를 가지고 있다. 이러한 모델이 제대로 실행되려면 강력한 데이터센터 GPU가 필요하다.
반면 MS의 파이-3-미니는 38억개의 매개변수만 포함하고 3조3000억개의 토큰으로 학습됐다. 이는 스마트폰과 노트북에서 볼 수 있는 소비자용 GPU 또는 AI 가속 하드웨어에서 실행하기에 이상적이라고 한다. 또한 파이-3-미니의 성능은 미스트랄 8x7B, GPT-3.5와 같은 모델에 필적한다고 MS는 주장했다.
파이-3는 MS의 클라우드 서비스 플랫폼인 애저에서 즉시 사용할 수 있으며, 기계학습 모델 플랫폼인 허깅페이스 및 올라마(Ollama)에서도 사용할 수 있다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.