컨텐츠로 건너뛰기
검색
디지털투데이 언론사 이미지

구글 딥마인드, AI 로봇 혁신…'생각'하고 '행동'하는 로봇 공개

디지털투데이
원문보기

구글 딥마인드, AI 로봇 혁신…'생각'하고 '행동'하는 로봇 공개

속보
11월 생산 0.9%↑·소비 3.3%↓·투자 1.5%↑
[AI리포터]

[디지털투데이 AI리포터] 구글 딥마인드가 로봇이 생각하고 행동할 수 있는 새로운 AI 모델을 발표했다고 25일(현지시간) IT매체 아스테크니카가 전했다.

이번에 공개된 모델은 제미나이 로보틱스 1.5(Gemini Robotics 1.5)와 제미나이 로보틱스-ER 1.5(Gemini Robotics-ER 1.5) 두 가지다.

먼저 제미나이 로보틱스 1.5는 시각·언어·행동(VLA) 모델로, 시각·텍스트 데이터를 입력받아 로봇의 동작을 계획하고 실행한다. 반면 제미나이 로보틱스-ER 1.5는 구현된 추론(ER) 기능을 강조한 모델로, 시각·텍스트 입력을 바탕으로 복잡한 과제를 수행하기 위한 단계별 지침을 자연어로 출력한다. 현재 ER 모델은 직접 행동하지 않고, 물리적 공간에서 필요한 지침만 제공한다.

딥마인드에 따르면, ER 모델은 현대 챗봇의 생각과 유사한 시뮬레이션된 추론 능력을 갖췄으며, 학술 및 내부 벤치마크 테스트에서 최상위 성능을 기록했다. 아울러 제미나이 로보틱스 1.5는 ER 모델이 생성한 지침을 받아 시각 정보를 활용해 실제 로봇 동작으로 전환한다.

딥마인드 로봇 담당 책임자는 "생성형 AI가 로봇에 일반적인 기능을 부여해 학습 부담을 크게 줄일 수 있다"고 말했다. 카니슈카 라오 연구원은 "인간이 직관적으로 생각하는 과정을 로봇이 수행하게 하는 것이 큰 진보"라며 "VLA 모델 1.5는 행동을 실행하기 전에 먼저 사고하는 능력을 갖췄다"고 설명했다.

두 모델은 모두 제미나이 기반 모델을 토대로 하며, 물리적 환경에 적합하도록 추가 학습 데이터를 적용했다. 이를 통해 로봇은 복잡한 다단계 작업을 처리할 수 있게 되었고, 에이전트형 로봇 기술의 진전으로 평가된다. 실제로 딥마인드는 제미나이 로보틱스 1.5를 알로하 2(Aloha 2), 인간형 로봇 아폴로(Apollo) 등 다양한 플랫폼에 시험 적용했다. 그 결과 알로하 2의 그립퍼 기술을 아폴로의 손에 옮겨도 별도의 튜닝 없이 학습이 가능함을 확인했다.

현재 제미나이 로보틱스 1.5는 제한된 테스터에게만 제공되고 있다. 반면 제미나이 로보틱스-ER 1.5는 구글 AI 스튜디오(Google AI Studio)를 통해 공개돼, 개발자들이 물리적 로봇에 활용할 수 있는 명령어를 생성하고 실험할 수 있도록 지원하고 있다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>