![]() |
GRASPSAM 전체 파이프라인. |
광주과학기술원(GIST·총장 임기철)은 이규빈 인공지능(AI)융합학과 교수팀이 단순한 자동화를 넘어 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델 '그랩샘(GraspSAM)'을 개발했다고 29일 밝혔다.
산업 현장에서 로봇이 물체를 정확하고 안정적으로 잡기 위해서는 정교한 파지(Grasp) 기술이 필수적이다. 하지만 기존 파지 기술은 물체의 종류나 환경 변화에 따라 새로운 모델 학습이 필요하며 제한된 데이터세트에 의존하는 한계가 있었다.
작업자와의 협업을 고려한 혁신적 AI 모델인 GraspSAM은 점·박스·텍스트 등 다양한 형태의 프롬프트 입력을 지원한다. 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있도록 설계했다. 기존 모델의 한계를 극복하고 학습되지 않은 물체라도 복잡한 환경에서 안정적으로 파지할 수 있는 능력을 갖췄다. 딥러닝 기반 파지 모델들은 환경과 상황에 따라 별도의 AI모델을 학습해야 하는 한계를 지니고 있었다.
![]() |
왼쪽부터 이규빈 AI융합학과 교수, 노상준 박사과정생, 김종원·강래영·남동우 석박사통합과정(박사과정), 백승혁 한국기계연구원 선임연구원. |
연구팀은 이를 해결하기 위해 페이스북 모회사 메타(Meta)가 개발한 범용 이미지 분할 모델인 샘(SAM·Segment Anything Model)을 최초로 로봇 파지 출력이 가능하도록 도입했다.
GraspSAM은 SAM의 강력한 객체 분할 능력을 활용해 최소한의 미세 조정만으로 물체의 파지점을 예측하는 혁신적인 모델이다. 이를 위해 어댑터 기법과 학습 가능한 토큰 기법을 적용해 SAM을 파지점 추론에 최적화했다. 프롬프트 기반 입력을 지원하며 사용자가 제공하는 간단한 점, 박스, 텍스트 입력으로 다양한 환경·물체·상황에 즉각적으로 적응할 수 있다. 로봇이 보다 다양한 물체를 손쉽게 잡을 수 있으며, 단 한 번의 연산만으로 파지점을 예측해 산업 현장에서의 적용 범위를 획기적으로 확장했다.
유명한 파지 벤치마크 데이터세트인 '그랩 에니씽(Grasp-anything)'과 '자카드(Jacquard)'에서 최고 수준의 성능을 달성했다. 실험 결과 복잡한 실제 환경에서도 로봇이 안정적으로 파지 작업을 수행할 수 있다는 것을 확인했다. 특히 눈동자 추적 기술과 결합해 작업자의 시선에 맞춰 파지 작업을 수행하는 기능까지 성공적으로 구현함으로써 산업 현장은 물론 다양한 분야에서 폭넓은 활용 가능성을 제시했다.
이규빈 교수는 “GraspSAM 모델은 로봇과 사용자의 직관적인 상호작용을 가능하게 하며, 복잡한 환경에서도 탁월한 파지 능력을 발휘해 산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다”고 말했다.
김영준 기자 kyj85@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.