<이미지를 클릭하시면 크게 보실 수 있습니다> |
네이버가 자사 대화형 인공지능(AI) 에이전트 서비스인 '클로바X'에 이미지 인식 기능을 본격 탑재한다. 오픈AI·구글 등 글로벌 빅테크들이 보다 진화된 챗봇을 구현하기 위해 텍스트를 넘어 이미지·음성 등 다양한 형태의 데이터를 동시에 이해하고 처리하는 '멀티모달' AI를 표방하고 있지만 '유료' 모델을 지향하고 있다는 점에서 상대적으로 네이버는 '무료' 모델을 통한 이용자 록인 효과를 거두겠다는 전략이다. 앞서 네이버는 자사 포털 서비스 네이버 내 쇼핑(커머스)과 검색 등 일부 영역에서 이미지 탐색 AI를 적용한 바 있다.
대화형 AI 에이전트는 단순한 대화와 일방향으로 정보를 제공하는 수준의 챗봇과는 달리, 이용자가 요구하는 수준에 맞춰 실시간으로 정보를 탐색하고 창작 등 보다 고도화된 업무까지 스스로 수행할 수 있는 수준의 AI 비서를 표방한다. 21일 정보기술(IT) 업계에 따르면 네이버는 이달 중으로 클로바X에 이미지를 인식하고 관련 질의응답을 이어나갈 수 있는 멀티모달 기능을 추가할 계획이다. 이르면 다음주부터 클로바X 일반 사용자들이 이 기능을 접할 수 있게 된다.
가령 이용자가 수학 문제를 캡처한 사진을 올린 뒤 답을 구해달라고 클로바X에 요청하거나, 이미지 속 모습과 연관된 시를 창작해 줄 것을 주문하는 등 기존 텍스트 중심의 대화가 이미지로 확대되는 것이다. 특히 기존 클로바X에선 PDF, TXT, HWP, DOCX 등 문서를 첨부한 다음 이와 연계된 대화가 가능했지만 이 역시 문서 내 텍스트만 인식이 가능해 도표나 그래프의 경우 질의응답이 이어질 수 없는 한계가 있었다. 하지만 앞으로는 그래프 수치를 토대로 제안서를 작성해 달라라고 하는 등 보다 전문화된 업무까지도 가능하게 될 전망이다.
추가로 네이버는 클로바X에서 사용자가 업로드한 이미지 일부를 삭제하거나 변경하는 등 편집 기능을 현재 사용자를 대상으로 테스트 중인데, 보완 과정 등을 거쳐 추후 전체 이용자를 대상으로 세부 기능을 순차적으로 개시한다는 계획이다. 여기엔 이미지 속 배경을 바꾸거나 인물이 착용한 의상의 색을 변경하는 등 사례가 거론된다. 다만 이미지 편집 기능이 적용되는 시점은 아직 정해지지 않은 것으로 파악된다. 최근 LG AI연구원도 자체 최신 AI 모델 엑사원 3.0을 기반으로 한 생성형 AI 서비스 '챗엑사원' 시험 버전에서 이미지 기반 질의응답이 가능한 에이전트를 선보이기도 했다. 다만 이 서비스는 LG 임직원을 대상으로 제한하고 있다. 정식 서비스 개시 일정은 미정이다. 상대적으로 주요 글로벌 빅테크 기업은 이미지 탐색 AI를 속속 접목한 상태다. 구글은 자사 AI 챗봇인 '제미나이'에 해당 기능을 탑재해 이미지를 업로드하면 질문과 답변을 주고받을 수 있도록 했다. 오픈AI의 '챗GPT'와 앤스로픽의 '클로드' 같은 챗봇에도 해당 기능이 적용된 상태다. 여기에 더 큰 보폭으로 해외 테크 기업들은 음성과 동영상까지도 인식 가능한 AI 에이전트를 구축해 나가고 있는 분위기다.
속도면에서 국내 기업과 해외 테크사 간 차이가 발생하는 것은 단연 '비용' 문제가 크다. 네이버의 경우 클로바X가 무료 서비스이지만, 오픈AI의 멀티모달 AI 서비스 '챗GPT 4o'는 유료다. 구글의 '제미나이 라이브'나 앤스로픽의 '클로드3.5 소네트' 역시 과금이 되는 구조다.
하정우 네이버클라우드 AI이노베이션센터장은 이미지 탐색 AI를 먼저 탑재한 데 대해 "멀티모달 기술이 입력 단계에서 사용성과 접근성을 극도로 향상시켜주기 때문에 이미지 의미 기반 탐색이 더 유용하다"고 강조했다. 한편 이미지 탐색·분석 AI는 챗봇을 포함한 대화형 AI 에이전트에만 녹여져 있는 것은 아니다. 구글은 스마트폰 카메라를 비추면 실시간으로 이를 인식해 해당 이미지에 대한 정보를 제공하는 서비스인 '구글 렌즈'를 선보였다. 이미지 탐색 AI는 특히 챗봇과 전자상거래에서 큰 힘을 발휘할 것으로 보인다. 사용자는 원하는 옷이나 아이템을 올려 유사한 제품을 손쉽게 찾을 수 있다.
[고민서 기자 / 이상덕 기자]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.