컨텐츠로 건너뛰기
검색
이코노믹리뷰 언론사 이미지

비싼 GPU 없어도 돌아가는 토종 AI의 반격... 카카오 카나나 오픈소스로 승부수

이코노믹리뷰
원문보기

비싼 GPU 없어도 돌아가는 토종 AI의 반격... 카카오 카나나 오픈소스로 승부수

속보
경찰, 이 대통령 피습 테러사건 TF 구성
[최진홍 기자] 글로벌 빅테크 기업들의 AI 개발 경쟁이 천문학적인 인프라 비용 싸움으로 치닫는 가운데 카카오가 비용 효율성을 앞세운 실용주의 노선으로 틈새 공략에 나섰다. 구하기 힘든 최신 칩이 없어도 고성능을 내는 모델을 누구나 쓸 수 있게 풀어 국내 AI 생태계의 주도권을 잡겠다는 전략이다.

카카오는 20일 자사 차세대 언어모델 Kanana-2(카나나-2)를 업데이트하고 4종의 모델을 오픈소스로 전격 공개했다고 발표했다.

이번 공개는 단순한 기술 과시를 넘어 AI 개발의 높은 진입장벽을 낮추겠다는 의도가 깔려있다. 현재 AI 업계는 엔비디아의 최신 그래픽처리장치(GPU) 확보난으로 인해 중소기업이나 학계가 고성능 모델을 운용하기 어려운 실정이다. 카카오는 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 GPU에서도 원활하게 돌아가는 모델을 내놓으며 이들의 수요를 정조준했다.

핵심은 덩치는 유지하되 움직임은 가볍게 만든 전문가 혼합(MoE) 아키텍처 기술이다. 전체 파라미터(매개변수)는 320억개 규모로 거대 모델의 지능을 갖췄지만 실제 추론을 할 때는 상황에 맞는 30억개의 파라미터만 활성화해 쓴다. 필요한 뇌세포만 골라 쓰는 방식으로 연산 효율을 극대화해 비용 부담을 낮춘 것이다.

여기에 AI가 새로운 정보를 배울 때 기존 지식을 잊어버리는 치명적 망각 현상을 막기 위해 리플레이 기법을 도입했다. 사전 학습과 사후 학습 사이에 미드 트레이닝 단계를 신설해 한국어 구사 능력과 일반 상식은 유지하면서도 새로운 추론 능력을 덧입히는 데 성공했다.

카카오는 이번 모델이 단순 대화형 AI를 넘어 실질적인 업무 수행이 가능한 에이전틱 AI(Agentic AI) 구현에 특화됐다고 강조한다. 복잡한 지시를 이해하고 적절한 도구를 스스로 선택해 사용하는 도구 호출 능력을 대폭 강화했다. 실제 성능 평가에서 동급 경쟁 모델인 중국 알리바바의 Qwen-30B-A3B-Instruct-2507 대비 지시 이행 정확도와 한국어 능력 등에서 앞선 성적을 냈다.



이번에 공개된 모델은 기본 모델부터 지시 이행 모델, 추론 특화 모델 등 총 4종이다. 카카오는 연구 목적으로 활용도가 높은 미드 트레이닝 탐색용 모델까지 함께 제공하며 오픈소스 생태계 확장에 공을 들이고 있다. 폐쇄적인 정책을 고수하는 일부 빅테크와 달리 소스를 공개해 우군을 확보하고 자사 모델을 표준으로 만들겠다는 계산이다.

카카오는 현재 이 기술을 바탕으로 체급을 키운 수천억 파라미터 모델 Kanana-2-155b-a17b의 학습도 진행 중이다. 중국의 유니콘 기업 지푸 AI(Zhipu AI)의 모델 대비 40% 수준의 데이터만으로도 동등한 성능을 보이고 있다. 특히 최신 칩의 효율을 극대화하는 8비트 학습 방식을 도입해 글로벌 최상위 수준의 성능을 목표로 하고 있다.

김병학 카카오 카나나 성과리더는 "새로워진 Kanana-2는 어떻게 하면 고가의 인프라 없이도 실용적인 에이전트 AI를 구현할 수 있을까에 대해 치열하게 고민한 결과"라며 "보편적인 인프라 환경에서도 고효율을 내는 모델을 오픈소스로 공개함으로써 국내 AI 연구 개발 생태계 발전과 기업들의 AI 도입의 새로운 대안이 될 수 있기를 기대한다"고 말했다.

<저작권자 Copyright ⓒ ER 이코노믹리뷰 무단전재 및 재배포 금지>