카카오브레인, 멀티모달 AI 소스코드 누구나 쓸 수 있게 공개
정신아 카카오 대표 내정자 "AI 시대에는 기업 협업과 생태계 발현 중요"
카카오 브레인이 공개한 인공지능 '허니비' 작동 예시 (카카오브레인 제공) 2024.01.19 /뉴스1 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
(서울=뉴스1) 김승준 기자 = 카카오브레인이 이미지와 텍스트를 융합해 처리하는 인공지능 '허니비'를 오픈소스로 공개했다. 누구나 소스코드를 활용할 수 있어 카카오 자체 서비스 확장뿐 아니라 업계 전반에 긍정적 영향을 미칠 것으로 보인다.
20일 카카오브레인에 따르면 전날 깃허브를 통해 공개한 '허니비'(Honeybee)는 이미지와 텍스트 입력을 분석해 텍스트로 결과물을 내놓는 멀티모달 거대언어모델이다.
예를 들어 운동선수 사진과 함께 최근 성적을 알려달라면 AI가 이미지에서 누구인지를 구별하고 텍스트 명령에 따라 답을 내놓는 식이다.
정신아 카카오 대표 내정자는 과학기술정보통신부의 제5차 인공지능 최고위 전략대화에 참석해 허니비를 소개하며 "이미지와 텍스트가 융합된 형태로 서비스의 확장성이 기대된다"고 말했다.
멀티모달 AI는 현재 복합 검색 등으로 접할 수 있다. 향후에는 물체와 언어를 복합적으로 분석하는 대부분의 영역에서 응용될 전망이다.
기존의 텍스트 의료 답변 AI의 경우 환자가 자신의 증상을 말로 일일이 설명해야 한다. 멀티모달이 적용되면 환부의 사진 등을 이용한 분석으로 심층 답변을 할 수 있다. 구글도 X레이, CT촬영물, 의료 차트 등을 결합해 의료 관련 질문에 답변하는 'Med-PaLM' 시리즈를 개발해 오고 있다.
또 쇼핑·커머스 영역에서도 소비자가 복잡한 모델명이나 일련번호를 입력하지 않고 제품을 찍은 사진으로 고장 신고, 관련 제품 추천 등 서비스를 받을 수 있게 된다.
이외에도 시각 정보를 거대언어모델 AI로 연결해 구현할 수 있는 서비스는 무궁무진하다. 예를 들어 가정에서 냉장고 안의 식재료를 카메라로 인식하고 요리법을 추천하거나 건강한 식생활을 유도하는 메시지를 생성하는 식이다.
멀티모달 AI는 활용가능성은 폭넓지만 공개된 모델이 적고 학습 방법도 알려지지 않아 개발이 어려운 것으로 전해졌다.
카카오의 '허니비'를 오픈소스 공개가 국내 AI 생태계 발전에 도움이 될 것으로 기대되는 배경이다. 스타트업이나 개인 개발자 누구나 접근이 가능하다.
카카오브레인 역시 오픈소스 형식으로 공개한 이유로 멀티모달 언어모델 생태계 발전을 들었다. 허니비는 각종 멀티모달 벤치마크(성능시험)에서 최고 수준의 성적을 받기도 했다.
정신아 카카오 대표 내정자는 "모바일 시대에는 각각 열심히 하면 승자가 탄생했었다"며 "AI 시대에는 기업의 협업과 생태계 발현이 중요하다"고 강조했다.
정신아 카카오 대표 내정자 19일 오전 서울 영등포구 전경련플라자에서 열린 제5차 인공지능 최고위 전략대화에서 참석해 손뼉을 치고 있다. 2024.1.19/뉴스1 ⓒ News1 김도우 기자 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
seungjun241@news1.kr
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.