지난 12일 미국 실리콘밸리 마운틴뷰에 있는 컴퓨터역사박물관에서 열린 '휴머노이드 서밋'에서 전 세계 로봇 산업을 이끄는 두 기업 미국 구글과 중국 샤오펑이 각기 다른 전략을 들고 무대에 섰다. 캐롤라이나 파라다 구글 딥마인드 로보틱스 총괄과 야오젠 샤오펑 이사는 각각 '지능형 소프트웨어 플랫폼'과 '인간 유사 하드웨어의 통합'이라는 상반된 비전을 제시하며 휴머노이드의 미래를 그렸다.
파라다 총괄은 발표 시작부터 로봇의 '지능'을 강조했다. 그는 현재 로봇이 특정 작업에만 프로그래밍돼 있어 환경에 대한 수많은 가정을 전제로 새로운 애플리케이션 배포에 수개월이 걸리는 한계를 지적했다. 구글의 목표는 물리적 세계의 지능을 해결해 로봇이 어떠한 환경에서도 일반적인 작업을 수행할 수 있도록 만드는 것이다.
구글 전략의 핵심은 인공지능(AI) 파운데이션 모델인 '제미나이 1.5'를 로보틱스에 접목하는 것이다. 파라다 총괄은 이를 통해 로봇이 시각·언어·행동을 통합적으로 이해하는 '비전 언어 행동(VLA·Visual-Language-Action)' 모델을 구축했다고 설명했다. 특히 주목할 점은 '교차 신체 학습'이다. 구글은 휴머노이드, 4족 보행 로봇, 양팔 로봇 등 다양한 형태의 로봇 데이터를 하나의 모델로 학습시켜 특정 로봇이 경험하지 못한 동작까지 수행할 수 있는 일반화 능력을 보여줬다. 실제로 시연 영상에서 로봇은 농구공을 처음 봤음에도 "농구공을 집어 슬램덩크를 하라"는 명령을 이해하고 200밀리초(㎳) 만에 판단을 내려 행동으로 옮겼다. 또 샌프란시스코의 쓰레기 분리수거 규정을 검색해 물건을 분류하거나 세탁물을 정리하는 등 복잡한 다단계 추론이 필요한 작업도 수행했다.
파라다 총괄은 발표 시작부터 로봇의 '지능'을 강조했다. 그는 현재 로봇이 특정 작업에만 프로그래밍돼 있어 환경에 대한 수많은 가정을 전제로 새로운 애플리케이션 배포에 수개월이 걸리는 한계를 지적했다. 구글의 목표는 물리적 세계의 지능을 해결해 로봇이 어떠한 환경에서도 일반적인 작업을 수행할 수 있도록 만드는 것이다.
구글 전략의 핵심은 인공지능(AI) 파운데이션 모델인 '제미나이 1.5'를 로보틱스에 접목하는 것이다. 파라다 총괄은 이를 통해 로봇이 시각·언어·행동을 통합적으로 이해하는 '비전 언어 행동(VLA·Visual-Language-Action)' 모델을 구축했다고 설명했다. 특히 주목할 점은 '교차 신체 학습'이다. 구글은 휴머노이드, 4족 보행 로봇, 양팔 로봇 등 다양한 형태의 로봇 데이터를 하나의 모델로 학습시켜 특정 로봇이 경험하지 못한 동작까지 수행할 수 있는 일반화 능력을 보여줬다. 실제로 시연 영상에서 로봇은 농구공을 처음 봤음에도 "농구공을 집어 슬램덩크를 하라"는 명령을 이해하고 200밀리초(㎳) 만에 판단을 내려 행동으로 옮겼다. 또 샌프란시스코의 쓰레기 분리수거 규정을 검색해 물건을 분류하거나 세탁물을 정리하는 등 복잡한 다단계 추론이 필요한 작업도 수행했다.
한편 샤오펑의 야오 이사는 자사의 로봇 '아이언'을 소개하며 "가장 인간과 유사한 로봇을 만드는 것이 목표"라고 밝혔다. 샤오펑이 정의하는 휴머노이드는 외형뿐만 아니라 움직임, 소통 그리고 행동 방식까지 모든 차원에서 인간을 닮아야 한다.
샤오펑의 접근 방식은 하드웨어와 소프트웨어의 긴밀한 '공동 설계'에 있다. 야오 이사는 로봇의 배터리 수명, 발열 관리, 실시간 처리 속도 등을 고려했을 때 단순히 거대언어모델(LLM)을 로봇에 이식하는 것만으로는 한계가 있다고 지적했다. 따라서 샤오펑은 모델 아키텍처와 추론 엔진을 하드웨어 특성에 맞춰 처음부터 함께 설계해 온디바이스 환경에서 효율적으로 작동하도록 최적화했다.
가장 눈길을 끈 것은 명확한 상용화 일정이었다. 야오 이사는 "2026년 말까지 대량 생산을 목표로 하고 있다"고 밝혔다. 초기에는 샤오펑의 자동차 대리점이나 공장에서 고객 응대, 부품 운반 등 업무를 수행하며 신뢰성을 검증할 계획이다.
이번 서밋에서 구글은 로봇 형태와 상관없이 적용할 수 있는 '범용 AI 두뇌'를 제공하겠다는 포부를 드러냈다. 제미나이 1.5를 통해 로봇이 처음 보는 물체와 환경에서도 인간 수준의 추론과 작업을 수행할 수 있음을 증명하며 소프트웨어 파워를 과시했다.
반면 샤오펑은 테슬라와 유사한 수직 통합 전략을 보여줬다. 하드웨어 제약 사항을 고려한 최적화된 AI 모델 설계와 구체적인 양산 계획을 제시하며 실제 물리적 제품으로서 휴머노이드를 완성해나가겠다는 의지다.
[실리콘밸리 원호섭 특파원]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
