<이미지를 클릭하시면 크게 보실 수 있습니다> |
구글이 연례 개발자 회의 'I/O 2024'에서 최신 인공지능(AI) 모델인 '제미나이 프로 1.5(Gemini Pro 1.5)'를 공개하며 "AI와 직접 상호작용하는 현실이 왔다"고 선언했다.
구글은 14일(현지시간) 미국 캘리포니아주 마운틴뷰 본사에서 I/O 2024를 개최하고 제미나이 최신 버전을 소개했다. 매년 5월 이틀간 열리는 I/O는 구글의 신제품과 신기술을 발표하는 장으로 전 세계의 이목을 끄는 초대형 ICT 행사 중 하나다.
이날 구글은 자사 AI 모델인 제미나이 1.5 프로와 경량 모델인 플래시를 공개했다. 제미나이 1.5 프로는 현 구글 AI 최상위 모델로, 데이터 및 알고리즘 개선을 통해 혁신적인 AI 서비스를 선보인다. 제미나이는 사용자가 "신발이 작아 교환해야겠어"라고 말하면 사용자가 주문했던 쇼핑몰을 찾아 반품 접수를 하고 평소 신던 신발 크기로 교환까지 수행한다. 멀티모달 능력으로 "수영 실력이 얼마나 늘었는지 궁금하다"라는 요청에는 사진을 시간 순으로 배열해 바로 확인할 수 있도록 해준다.
최대 100만 토큰을 처리할 수 있어 긴 문서, 비디오, 대규모 코드베이스 연산도 소화할 수 있다. 이전 버전은 20만 토큰이 한계였다. 멀티모달 능력을 통해 텍스트뿐 아니라 오디오와 비디오 등 다양한 입력 유형을 지원한다. 더불어 MoE(Mixture-of-Experts) 아키텍처를 사용해 일부 연산 능력만 활성화함으로써 속도와 응답 품질을 향상시키며 연산 과정을 단축시켰다. 그 결과 10만 줄 이상의 개발 코드를 분석하고 각 부분의 작동 방식을 설명하는 등 고난이도 연산까지 가능해졌다. 제미나이 플래시는 경량화 모델로 반복작업에 최적화 했다. 올 여름 중에는 오픈소스 소형언어모델(SLM) '젬마 2.0'도 출시 될 예정이다.
순다르 피차이 구글 & 알파벳 최고경영자(CEO)는 "현재 전 세계 20억 명이 구글 검색, 구글 포토, 구글 워크스페이스, 안드로이드 등 다양한 구글 제품을 통해 제미나이를 경험하고 있다"며 "한 단계 더 진화한 모델을 통해 보다 빠르고 정확하며 풍부한 피드백을 받을 수 있다"고 설명했다.
피차이는 이번 AI 모델을 이용자 중심 검색 경험 최적화에 초점을 맞췄다고 밝혔다. '프로젝트 아스트라'는 멀티모달 AI 비서로 제미나이 최신 버전으로 구동된다. 아스트라는 사용자가 보고 듣는 바를 그대로 함께 보고 듣는다. 스마트폰 카메라를 통해 보이는 사물을 분석하고 때와 장소에 맞춰 답변을 생성해 음성 명령에 답한다. 구글은 제미나이 앱과 자사 제품 전반에 아스트라 기능을 추가할 예정이지만, 카메라 등을 이용하는 만큼 기능이 제한될 가능성도 있다.
이날 구글은 텍스트를 통해 동영상을 생성하는 비오(Veo), 텍스트로 사진을 생성하는 이마젠(Imagen)의 최신 버전 이마젠 3, AI로 음악을 만들 수 있는 리리아(Lyria) 등도 공개했다. 구글 검색 역시 진일보 한다. 구글 검색 책임자인 리즈 리드는 검색 결과 'AI 개요'를 검색 결과 상단에 표시하는 기능도 정식으로 선보일 예정이라고 설명했다. 구글은 검색 시스템이 다단계 추론을 통해 복잡한 질문에 답할 수 있을 것이라고 설명했다
피차이는 "우리는 모든 사람이 제미나이를 통해 혜택을 누릴 수 있길 바란다"며 "앞으로 사람들은 모바일과 안드로이드는 물론 iOS로도 제미나이와 직접 상호작용하게 될 것이다"라고 밝혔다.
한편, 구글은 이날부터 AI 스마트폰 '픽셀8a'를 공식 출시하고 판매를 시작했다. 지난 7일부터 일부 국가에서 사전예약을 시작한 픽셀8a는 생성형 AI 기능 구현을 위해 스마트폰의 두뇌인 AP(앱 프로세서)로 구글의 자체 칩인 '텐서 G3'를 탑재했다. 제미나이 또한 탑재 돼 브레인스토밍, 노트 작성, 일정 정리 등 다양한 일상 작업에 도움을 준다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.