[박찬 기자]
구글이 차세대 자율형 인공지능(AI) 시대를 겨냥해 '제미나이 딥 리서치(Gemini Deep Research)'를 전면 재설계하고, 이를 개발자에게 개방했다. 단순한 고급 리서치 도구의 성능 개선으로 보일 수 있지만, 업계에서는 이번 발표를 두고 "정보 탐색과 검증, 자동화 방식 자체를 바꾸려는 구글의 장기 전략"이라는 평가가 나왔다.
구글은 12일(현지시간) '제미나이 3 프로(Gemini 3 Pro)'를 활용한 리서치 에이전트 '제미나이 딥 리서치'의 개편 버전을 API를 통해 출시했다.
제미나이 딥 리서치는 방대한 정보를 장시간 수집하고 이를 종합·분석하는 작업에 최적화된 에이전트다.
구글이 차세대 자율형 인공지능(AI) 시대를 겨냥해 '제미나이 딥 리서치(Gemini Deep Research)'를 전면 재설계하고, 이를 개발자에게 개방했다. 단순한 고급 리서치 도구의 성능 개선으로 보일 수 있지만, 업계에서는 이번 발표를 두고 "정보 탐색과 검증, 자동화 방식 자체를 바꾸려는 구글의 장기 전략"이라는 평가가 나왔다.
구글은 12일(현지시간) '제미나이 3 프로(Gemini 3 Pro)'를 활용한 리서치 에이전트 '제미나이 딥 리서치'의 개편 버전을 API를 통해 출시했다.
제미나이 딥 리서치는 방대한 정보를 장시간 수집하고 이를 종합·분석하는 작업에 최적화된 에이전트다.
추론 엔진으로는 구글의 최신 모델인 제미나이 3 프로가 사용됐으며, 환각을 최소화하고 보고서 품질을 극대화하도록 특별히 훈련됐다. 다단계 강화학습 기반의 검색 전략을 확장 적용해, 복잡한 정보 환경에서도 높은 정확도로 자율 탐색이 가능하다.
이 에이전트는 스스로 조사 계획을 세우고, 검색 쿼리를 생성한 뒤 결과를 읽고 지식 공백을 파악해 재검색을 반복한다. 특히 이번 버전에서는 웹 검색 성능이 크게 개선돼, 특정 데이터를 찾기 위해 웹사이트 내부 깊숙한 영역까지 탐색할 수 있다.
이번 업데이트의 핵심 변화는 기능 확장에 있다. 제미나이 딥 리서치는 보고서 생성 도구에 머무르지 않는다. 구글이 새롭게 공개한 '인터렉션(Interactions) API'를 통해 개발자들은 이 에이전트의 자율 리서치 역량을 자신들의 애플리케이션에 직접 내장할 수 있다.
이 API는 기존의 단순한 요청-응답 방식과 달리, 장시간 세션 유지와 서버 상태 관리, 다단계 계획 수립, 장기 추론 루프의 백그라운드 실행 등을 지원한다. 개발자는 PDF, CSV, 문서, 웹 링크, 데이터셋 등을 한꺼번에 제공할 수 있고, 에이전트는 스스로 필요한 정보를 판단해 검색을 반복하며 지식 공백을 메운다.
구글에 따르면 제미나이 딥 리서치는 이미 금융 실사, 시장 분석, 약물 독성 안전성 연구 등 고정밀 분야에서 활용되고 있다. 금융사들은 웹과 내부 자료 전반에서 시장 신호와 경쟁사 정보, 규제 리스크를 자동으로 수집·정리하는 데 이 에이전트를 쓰고 있으며, 바이오 분야에서는 방대한 생의학 문헌을 분석해 신약 개발 초기 연구를 가속화하고 있다.
기술적 진전을 입증하기 위해 새로운 오픈 소스 벤치마크 '딥서치QA(DeepSearchQA)'도 공개했다. 이 벤치마크는 기존 테스트들이 포착하지 못했던 현실적인 다단계 웹 리서치의 복잡성을 평가하는 데 초점을 맞춘다.
딥서치QA는 17개 분야에 걸친 900개의 '인과 체인(causal chain)' 과제로 구성돼 있으며, 단순한 정답 여부가 아니라 답변의 포괄성과 검색 재현율을 측정한다. 구글은 이를 통해 '더 많은 생각 시간(thinking time)'이 실제 성능 향상으로 이어지는지도 분석할 수 있다고 설명했다.
여기에서 제미나이 딥 리서치는 66.1%를 기록했다. 이는 제미나이 3 프로의 56.6%보다 10% 가까이 늘어난 수치이며, 오픈AI 'GPT-5 프로'의 65.2%를 넘어선 최고 기록이다.
또 일반 상식과 고난도 추론 능력을 평가하는 '인류의 마지막 시험(HLE)'에서는 46.4%, 브라우저 기반 에이전트 작업 성능을 평가하는 '브라우저컴프(BrowseComp)'에서는 59.2%의 성과를 보였다. 비교 대상 중에서는 최고 점수다.
하지만, 경쟁은 치열하다. 구글 발표 직후 오픈AI가 'GPT-5.2'를 공개하며, 일부 벤치마크에서는 순위가 뒤바뀌었다. 업계에서는 "벤치마크 우위는 발표 당일에만 유효하다"라는 냉소적인 반응도 나왔다.
하지만, 이번 발표의 의미는 수치 경쟁을 넘어선다는 평이다. 구글은 제미나이 딥 리서치를 구글 검색, 구글 파이낸스, 노트북LM, 제미나이 앱에 차례로 통합할 계획이다.
이는 사람들이 직접 검색어를 입력해 정보를 찾는 시대에서 벗어나, AI 에이전트가 대신 정보를 탐색하고 분석하는 환경을 준비하기 위한 다음 단계라는 분석이다.
동시에 구글이 코드명 '갈릭(Garlic)'으로 알려진 GPT-5.2 출시 직전 이를 공개했다는 데에도 관심이 모였다. 구글도 이제는 다른 곳처럼 경쟁사 견제에 나섰다는 평 나왔다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
