[사진: 오픈코더] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 중국 AI 기업 INF테크놀로지와 오픈소스 AI 연구 커뮤니티 'M-A-P'의 연구진이 새로운 대규모언어모델 '오픈코더'(OpenCoder)를 공개했다고 11일 온라인 매체 기가진이 전했다.
오픈코더는 최종 모델뿐만 아니라 학습 데이터 및 데이터 처리 파이프라인 등 모델을 재현하는 데 필요한 모든 정보를 공개한다.
대규모언어모델을 '개방형 모델'이라고 할 때, 어느 정도 개방되는지에 따라 그 종류는 오픈소스, 오픈웨이트, 오픈데이터 등 다양하다. 오픈코더의 경우 모든 부분을 공개하는 완전 개방형 모델이다.
현재 모델 생성 방법이 상세히 기술된 논문, 학습 후 모델 본체 및 튜터링에 사용된 450만개의 고품질 예제가 공개되어 있다. 그 외의 데이터에 대해서도 공개를 위한 작업이 진행 중이라고 한다.
한편, 오픈코더의 품질은 그리 높지않다는 평가다. 오픈AI의 GPT-4에는 미치지 못하고, 알리바바가 개발한 큐웬2.5 72B 모델이나 메타의 라마 3.1 70B 모델 등에도 현저히 떨어진다고 한다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.