컨텐츠로 건너뛰기
검색
디지털투데이 언론사 이미지

구글 딥마인드, 제미나이3 프로 세부 성능 공개…문서·공간·영상 이해력 혁신

디지털투데이
원문보기

구글 딥마인드, 제미나이3 프로 세부 성능 공개…문서·공간·영상 이해력 혁신

서울맑음 / -3.9 °
[AI리포터]

[디지털투데이 AI리포터] 구글 딥마인드가 지난 11월 출시된 인공지능(AI) 모델 '제미나이3 프로'(Gemini 3 Pro)의 구체적인 성능과 기술적 성과를 공개했다.

8일(현지시간) 온라인 매체 기가진에 따르면, 로한 도시(Rohan Doshi) 구글 딥마인드 제품 매니저는 "제미나이3 프로는 당사 역사상 가장 강력한 멀티모달 모델로, 문서 이해, 공간 이해, 화면 이해, 영상 이해 모든 영역에서 최고 성능을 발휘한다"고 설명했다.

먼저 문서 이해 분야에서 제미나이3 프로는 난해한 손글씨, 복잡한 표 구조, 수식, 비선형 레이아웃을 HTML, 라텍스(LaTeX), 마크다운(Markdown) 코드로 변환할 수 있다. 예를 들어, 18세기 상인의 자필 수첩을 재구성하거나 복잡한 수식을 읽어내며, 나이팅게일이 작성한 차트까지 정확히 해석한다.

공간 이해 측면에서도 오브젝트와 그 의도를 정확히 파악하며, 화면 이해 기능을 통해 PC 사용자 인터페이스(UI)를 인식하고 분석하는 능력을 갖췄다. 특히 영상 이해 부문에서 10FPS 처리 속도를 기록하며, 골프·테니스 스윙 분석 등 동작 이해에서도 뛰어난 성능을 보인다. 아울러 사고 모드에서는 단순히 영상 내용을 파악하는 것을 넘어 왜 그런 일이 일어나는지까지 추론한다.

또한 제미나이3 프로는 AI 모델의 추론 능력을 평가하는 'ARC-AGI-2' 테스트에서 54%라는 높은 점수를 기록했다. 작업당 비용은 31달러(약 4만6000원)로 타 AI 모델보다 높지만, 성능 면에서 압도적인 우위를 점하고 있다. 반면, 오픈AI GPT-5는 10% 점수에 1달러(약 1400원) 수준의 비용으로 저비용·고효율 전략을 택했다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>