컨텐츠로 건너뛰기
검색
전자신문 언론사 이미지

카카오, '카나나2' 업데이트…4종 모델 오픈소스로

전자신문
원문보기

카카오, '카나나2' 업데이트…4종 모델 오픈소스로

속보
美대법원, 트럼프 상호관세 적법성 금일 판결 안해
〈자료 카카오〉

〈자료 카카오〉


카카오는 자체 기술력으로 개발한 차세대 언어모델 '카나나2(Kanana-2)'를 업데이트해 오픈소스로 추가 공개했다고 20일 밝혔다.

카나나2는 지난 12월 허깅페이스에서 오픈소스로 선보인 언어모델이다. 한 달 만에 성능을 크게 업데이트한 4종 모델을 추가 공개했다. 이번에는 △기본 모델 △지시 이행 모델 △추론 특화 모델 △미드 트레이닝 모델을 각각 내놓았다.

이번 4종 모델은 고효율과 저비용의 성능 혁신은 물론 실질적인 '에이전틱 AI' 구현을 위한 도구 호출능력을 대폭 강화했다. 특히 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 그래픽처리장치(GPU)에서도 원활하게 구동되도록 최적화했다. 중소기업이나 학계 연구자도 비용 부담 없이 고성능 AI를 활용할 수 있다.

카나나2 효율성의 핵심은 '전문가 혼합(MoE)' 구조다. 전체 파라미터는 32B(320억개) 규모로 거대 모델의 높은 지능을 유지하면서 실제 추론 시에는 상황에 맞는 3B(30억개)의 파라미터만 활성화해 연산 효율을 높였다. 전문가 혼합 모델 학습에 필수적인 여러 커널을 직접 개발해 성능 손실 없이 학습 속도는 높이고, 메모리 사용량은 획기적으로 낮추는 성과를 거뒀다.

데이터 학습 단계도 고도화했다. 사전 학습과 사후 학습 사이에 '미드 트레이닝' 단계를 신설했다. AI 모델이 새로운 정보를 배울 때 기존 지식을 잊는 '치명적 망각' 현상을 방지하기 위해 '리플레이' 기법을 도입했다. 새로운 추론 능력을 추가하면서도 기존 한국어 구사와 일반 상식 능력을 안정적으로 유지했다.

〈자료 카카오〉

〈자료 카카오〉


카나나2는 단순 대화형 AI를 넘어 실질적인 업무 수행이 가능한 에이전트 AI 구현에 특화됐다. 고품질 멀티턴 도구 호출 데이터를 집중적으로 학습해 지시 이행과 도구 호출 능력을 대폭 강화했다. 복잡한 사용자 지시를 정확히 이해하고 적절한 도구를 스스로 선택·호출한다. 실제 성능 평가에서 동급 경쟁 모델인 'Qwen-30B-A3B-Instruct-2507' 대비 지시 이행 정확도, 멀티턴 도구 호출 성능, 한국어 능력 등에서 압 우위를 기록했다.


카카오는 전문가 혼합 구조를 기반으로 거대 스케일의 수천억 파라미터 모델 'Kanana-2-155b-a17b'의 개발을 위한 학습도 진행 중이다. 특히 중국 인공지능 스타트업 지푸 AI의 'GLM-4.5-Air-Base' 모델 대비 40% 수준 데이터를 학습한 상태에서 일반 지능(MMLU) 등 주요 벤치마크 성능 지표가 유사한 성능을 보였다.

김병학 카카오 카나나 성과리더는 “고가 인프라 없이 실용적인 에이전트 AI를 구현할 수 있는가에 대해 치열하게 고민한 결과”라면서 “국내 AI 연구 개발 생태계 발전과 기업의 AI 도입의 새로운 대안이 되기를 기대한다”고 말했다.

변상근 기자 sgbyun@etnews.com

[Copyright © 전자신문. 무단전재-재배포금지]