한국어 언어모델 성능 평가서 1위
독자기술로 국산모델 가능성 입증
독자기술로 국산모델 가능성 입증
정신아 카카오 대표이사 [카카오 제공] |
카카오의 자체 개발 인공지능(AI) 모델 ‘카나나’가 한국어 언어 모델 AI 성능 평가에서 상위권을 기록했다. 독자 기술을 기반으로, 국산 AI 모델의 경쟁력과 가능성을 입증했다는 평가다. 카카오는 ‘카나나’를 지속적으로 개발해 ‘소버린(국가주권형) AI’ 경쟁력 강화에 총력을 쏟을 방침이다.
26일 업계에 따르면 카카오가 최근 오픈소스로 공개한 ‘Kanana-1.5-8b-instruct’ 모델이 한국어 언어 모델(LLM)의 성능을 평가하기 위해 설계된 벤치마크 플랫폼 ‘호랑이(Horang-i) 리더보드’에서 8B 사이즈(매개변수 80억개) 이하의 모델 가운데 1위를 기록했다.
호랑이 리더보드는 미국 AI 개발자 플랫폼 웨이트앤바이어스(W&B)가 LLM의 한국어 성능 평가 결과의 랭킹을 공개하기 위해 운영하는 평가 리더보드다.
언어 모델의 한국어 능력을 비교하고, 국내외 다양한 언어모델을 대상으로 한국어 범용 성능, 정렬성, 정보 탐색 능력 등을 종합 평가하는 리더보드다. 특히 한국어 환경에서의 실질적 유용성을 중점적으로 평가해 국내 사용자 환경에 특화된 LLM 경쟁력을 가늠하는 중요한 기준으로 자리잡고 있다.
Kanana-1.5-8b-instruct 모델은 8B 이하의 모델 가운데 총점 0.691점을 기록하며 국내 모델 가운데 가장 높은 순위를 차지했다. 이와 더불어 호랑이 리더보드가 공개하는 15B 미만의 모델 중에서는 1위를 기록한 ‘Qwen2.5-14B’와 0.04점의 근소한 차이로 종합 순위 4위를 기록했다.
이는 모델의 아키텍처(구조), 데이터셋, 학습 프로세스 등을 모두 처음부터 구축하는 ‘프롬 스크래치’ 방식을 통해 설계 및 개발된 국내 LLM 중 가장 높은 순위에 해당한다.
프롬 스크래치 방식은 해외 모델의 단순 파인튜닝을 거친 방식과 달리, 모델의 아키텍처 최적화와 자체 데이터를 통해 학습된 국산 모델이라는 의미를 갖는다. 독자적인 기술력을 바탕으로 개발했다는 점과 동시에 모델이 높은 성능을 확보했다는 점도 주목할 점으로 꼽힌다.
카카오 관계자는 “한국어와 영어 모두에서 강력한 성능을 보이는 범용 언어모델이자, 성능과 비용 효율의 균형을 고려해 설계된 중형 크기의 모델”이라며 “다양한 AI 응용 서비스 구현에 효과적이며, 번역과 추론, 지식·질의응답, 구문해석 등의 벤치마크에서 전체 1위를 기록해 다수의 글로벌 모델과 비교해도 뛰어난 경쟁력을 보유했다”고 했다. 박세정 기자
