"AI로봇, 하드웨어보다 사용자 편의성서 승부날것"

매일경제 원문
황순민 기자(smhwang@mk.co.kr)
입력

2024.06.24 16:07

주소복사가 완료되었습니다

<이미지를 클릭하시면 크게 보실 수 있습니다>

"인간처럼 사고(思考)하고 행동하는 인공지능(AI) 로봇이 나오려면 지금 기술로는 어렵습니다. 물리적인 세계를 이해하는 AI 모델 개발과 이를 위한 데이터 학습 측면에서 새로운 돌파구가 필요합니다."

최근 매일경제와 만난 로봇 분야의 세계적 석학 김상배 매사추세츠공과대(MIT) 기계공학과 교수는 휴머노이드에 대한 시장의 폭발적 관심과 투자 열풍 속에서 현재 기술 수준을 냉정히 진단했다.

김 교수는 빅테크가 주목하는 세계적인 스타 로봇 연구자다. 그가 세계 최초로 개발한 전기모터 사족보행 로봇 '치타'는 업계에서 로봇공학의 패러다임을 바꾼 로봇이라는 평가를 받았다. 김 교수가 이끌고 있는 MIT 생체모방로봇연구소는 로봇 하드웨어 분야에서 세계 최고 수준의 기술력을 보유하고 있어 유수 기업들의 협업 제안이 끊이질 않는다.

요즘 테크 업계에서는 생성형 AI를 로보틱스에 접목해 실제 존재하는 세계로 적용하기 위한 시도가 주목을 받고 있다. 디지털 공간 내에만 머무르고 있는 AI를 로봇에 이식해 기계가 사람처럼 인식·행동할 수 있도록 유도한다는 아이디어다. 단순히 물건을 집어 새로운 위치에 내려놓는 수준에서 벗어나 로봇이 일상적인 상황을 예측하고 사람과 상호 작용할 수 있는 시대가 다가오고 있다는 장밋빛 전망까지 속속 나오는 상황이다. 일부 스타트업은 대규모언어모델(LLM)을 하드웨어(로봇)에 탑재한 시연 영상 등을 공개하면서 막대한 투자금을 유치하기도 했다.

김 교수는 "GPT와 같이 LLM을 기반으로 한 버추얼(VIRTUAL) AI를 단순히 로봇에 탑재한다는 발상으로는 특정 동작에 한정해 인간의 흉내를 내는 것 이상을 보여주기 어렵다"면서 "물리 세계를 실제로 이해하는 피지컬(physical) AI가 개발되지 못한 상황에서는 한계가 분명히 존재한다"고 지적했다. 사람처럼 생각하고 행동하는 휴머노이드를 개발하기 위해서는 완전히 다른 차원의 AI 모델 개발이 선행돼야 한다는 의미로 풀이된다.

예컨대 우리 몸을 동작하고 만지고 짚는 등의 지능은 모두 무의식적으로 이뤄진다. 아무리 알고리즘을 세밀하게 짜도 불확실성이 존재하는 물리적 세상에서는 단지 사람의 데이터를 모방하는 것만으로 로봇을 사람처럼 만들 수 없다는 분석이다. 김 교수는 "로봇에 비주얼·언어를 합쳐 우리가 상상하는 어마어마한 일을 할 수 있을지에 대해선 아직 검증이 안 됐고 자율주행 이상으로 기술이 진보할 수 있을지에 대한 의문 또한 존재한다"고 짚었다.

그러면서 김 교수는 '로봇의 뇌가 되어줄 수 있다는 언어모델이 정말 언어를 이해하고 있는가'에 대해 근본적인 질문을 제기했다. 그는 "언어모델은 언어를 이해하는 것이 아니라 언어 사이의 관계를 이해하고 있다"면서 "우리가 AI라고 부르는 것들은 데이터를 끌어모은 후 사람이 일일이 레이블링을 통해 이미지와 언어를 연결하는 작업을 거친다"고 했다.

실제로 생성형 AI에 쓰이는 언어 데이터는 다루기 쉬운 형태로 정돈된 경우가 많다. 이보다 다양성이 넓은 그림 데이터는 사람이 일일이 언어와 대조하는 레이블링 작업을 거쳐 학습시키고 있다.

이같이 만들어진 언어모델을 로봇에 탑재하더라도 시나리오 안에 존재하는 일을 반복하는 수준에 그칠 수밖에 없다는 지적이다. 이러한 로봇의 경우 외관이 인간처럼 보이지만 실상 인간처럼 할 수 있는 게 없는 반쪽짜리 휴머노이드가 될 수밖에 없다는 것이다.

로봇이 세상에 나왔을 때 실생활에서 마주할 변수는 무궁무진하다. 김 교수는 설거지를 하는 상황을 예로 들었다. 그는 "사람은 실수에 대응한다. 미끄러지면 다시 잡을 때도 있고, 접시를 떨어뜨리면 다시 집는다"며 "이 모든 상황에 대한 데이터를 학습시키는 것은 현재 모델로는 상상하기 어렵다"고 설명했다.

가상세계의 모방을 넘어 물리적인 현실을 이해하는 획기적인 AI 모델이 개발될 때 비로소 휴머노이드가 새로운 변곡점을 맞을 것이라는 게 김 교수의 예상이다. 이는 인류를 노동으로부터 해방시키는 역사적인 모멘텀이 될 수 있다. 김 교수는 "우리가 기대하는 액션 파운데이션 모델(물리적 AI) 개발을 위해서는 데이터 학습의 패러다임 자체를 바꿔야 한다"고 강조했다. 이 같은 관점에서 로봇 AI 모델 개발에서의 관건은 우선 충분한 데이터의 확보가 될 전망이다. 김 교수는 "수집해야 할 데이터의 양 또한 상상하기 어려울 정도"라면서 "지금의 데이터센터 규모로는 감당이 안 될 것이고 현행 데이터 수집 방법으로는 한계가 있어 새로운 돌파구가 필요하다"고 말했다.

시장 관점에서 김 교수는 "AI 로봇은 모든 회사가 같은 출발선에 있는 상황"이라고 진단했다. 그는 "특히 하드웨어 경쟁보다는 사용자 인터페이스에서 승패가 결정될 것"이라고 내다봤다. 최근 AI 로봇에 막대한 자금이 몰리는 상황에 대해서는 "휴머노이드에 투자가 쏟아지고 있지만 AI 분야에 유입되는 수준에 비하면 크지 않다"며 "로봇 산업의 경우 실질적인 성과가 나오기까지 5~10년 정도 장기적 안목과 인내가 필요하다"고 말했다. 그러면서 그는 "대표적으로 현대자동차의 경우 긴 호흡에서 매우 진지하게 로봇을 개발하고 있는 회사"라고 덧붙였다.

김 교수가 최근 관심을 갖고 연구하는 분야는 불확실성에 대응할 수 있는 로봇 '손'이다. 생명체의 전유물인 반사신경을 로봇에 부여하려는 새로운 시도로, 전 세계 로봇 업계가 그를 주목하고 있다. 김 교수 연구팀은 지난해 반사적으로 물건을 잡을 수 있는 로봇 손 그리퍼 개발에 성공했다. 그리퍼는 카메라와 손가락 끝에 달린 고대역폭 센서로 가까이에 있는 물건의 위치 등 데이터를 초당 200번 이상 실시간 기록한다. 물건의 위치가 갑자기 바뀌어도 측정값을 통해 즉각 반응할 수 있다. 시각 데이터에 의존하는 로봇들이 모든 것을 다시 계산하느라 반응이 느려지는 것과 대조적이다. 김 교수는 "더 복잡한 손을 개발하면 로봇의 용도가 다양화될 수 있을 텐데, 점프(도약점)가 어딘지 고민하고 있다"고 말했다.

[황순민 기자]

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

06.28 (금)

"AI로봇, 하드웨어보다 사용자 편의성서 승부날것"

매일경제 주요 뉴스