[박찬 기자]
구글이 차세대 월드 모델(WM) '지니 3(Genie 3)'를 공개했다. 텍스트 프롬프트만으로 몇분간 지속되는 상호작용 가능한 3D 세계를 생성하는데, 물리적 일관성과 장기 기억 능력까지 갖춰 인공일반지능(AGI)에 다가서는 기반이 될 수 있다는 평이다.
구글 딥마인드는 5일(현지시간) 실시간 인터랙티브 환경을 생성할 수 있는 범용 WM 지니 3'를 개발했다고 발표했다.
지니 3는 제한된 환경에 최적화된 기존 WM과 달리, 현실과 상상의 경계를 넘나드는 포토리얼리틱 3D 환경을 실시간으로 생성할 수 있는 최초의 범용 월드 생성 모델이다.
구글이 차세대 월드 모델(WM) '지니 3(Genie 3)'를 공개했다. 텍스트 프롬프트만으로 몇분간 지속되는 상호작용 가능한 3D 세계를 생성하는데, 물리적 일관성과 장기 기억 능력까지 갖춰 인공일반지능(AGI)에 다가서는 기반이 될 수 있다는 평이다.
구글 딥마인드는 5일(현지시간) 실시간 인터랙티브 환경을 생성할 수 있는 범용 WM 지니 3'를 개발했다고 발표했다.
지니 3는 제한된 환경에 최적화된 기존 WM과 달리, 현실과 상상의 경계를 넘나드는 포토리얼리틱 3D 환경을 실시간으로 생성할 수 있는 최초의 범용 월드 생성 모델이다.
연구 프리뷰 단계로 공개된 지니 3는 텍스트 프롬프트만으로 720p 고해상도에서 초당 24프레임의 속도로 몇분 동안 실시간 탐색이 가능한 역동적인 세계를 생성할 수 있다. 최대 20초간 제공했던 지니 2의 상호작용 가능 시간보다 훨씬 길어졌다.
또 프롬프트로 날씨 변화나 객체 생성과 같은 '프롬프트 기반 월드 이벤트'도 가능해졌다.
딥마인드는 지니 3가 기존 물리 엔진 없이도 자율적으로 물리 법칙을 학습하고 적용할 수 있다고 설명했다. 이 모델은 이전에 생성된 프레임을 참조해 다음 상태를 예측하는 자기회귀(auto-regressive) 방식으로 작동한다. 즉, 이전 장면을 바탕으로 다음에 등장할 장면을 생성하는 식이다.
이를 통해 모델은 일종의 '기억'을 기반으로 세계를 일관성 있게 시뮬레이션할 수 있어, 사물의 위치나 상태가 시간이 지나도 유지된다는 설명이다.
이런 특성은 게임이나 교육 콘텐츠 적용을 넘어, AI 에이전트나 로봇 훈련의 핵심 도구가 될 수 있다.
딥마인드는 지니 3가 "AGI로 향하는 여정에서 중요한 전환점이 될 것"이라고 강조했다. 특히 인간처럼 환경을 직접 체험하며 배우는 '체화 학습(embodied learning)'이 가능한 AI 에이전트 개발에 필수 요소라는 것이다.
실제로 딥마인드는 범용 멀티월드 에이전트 'SIMA'와 제니 3를 결합해 테스트한 결과, "초록색 압축기를 향해 이동하라" 등의 명령을 시뮬레이션 세계 안에서 정확히 수행하는 모습을 확인했다고 밝혔다. 이는 생성된 세계의 일관성과 현실성 덕분에 가능한 결과라는 설명이다.
한계도 존재한다. 예를 들어, 눈 위를 내려오는 스키어의 움직임과 눈의 반응 간 물리적 상호작용이 사실적으로 표현되지 않는 등 복잡한 물리 시뮬레이션에는 아직 제약이 있다. 또 복수의 독립적인 에이전트 간 상호작용이나 텍스트 생성, 장시간 지속되는 인터랙션 등에도 한계가 있다.
구글은 지니 3를 학계와 일부 창작자에게 제한적으로 제공하고 있으며, 광범위한 공개 이전에 위험성과 윤리 문제를 먼저 테스트할 계획이다. 일반 사용자는 아직 접할 수 없지만, 테스트 참여자를 확대하는 것도 검토 중이다.
딥마인드는 WM 기술을 AGI 개발의 핵심 축으로 보고 있다. 실제로 지니 3는 기존의 이미지 기반 월드 생성 모델을 넘어, 인간처럼 '계획하고, 탐색하며, 시행착오를 통해 학습'할 수 있는 AI 훈련의 새로운 지평을 열었다는 점에서 큰 의미를 갖는다는 평이다.
딥마인드는 "아직 체화 에이전트가 실제 환경에서 전례 없는 새로운 행동을 창출한 '무브 37(Move 37)' 같은 순간은 오지 않았다"라며 "하지만, 이제 그 문턱에 도달하고 있다"라고 강조했다.
무브 37은 알파고가 이세돌 9단과의 바둑 대결에서 보여준 혁신적인 37번째 수를 말하는 것으로, 지니 3가 AGI에 달성하는 '다음 수'를 만들어낼 수 있다는 것을 의미한다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
