컨텐츠 바로가기

12.22 (일)

네이버 '공간지능' 기술, 유럽컴퓨터비전학회서 구글·애플 제치고 '1위'

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

정밀지도 없이도 정확한 측위…"12개팀 중 압도적으로 1위"

네이버클라우드도 논문 11건 채택…비전 AI 기술 고도화 성과

[아이뉴스24 정유림 기자] 네이버는 연구개발(R&D) 자회사 네이버랩스가 연구해온 공간지능(Spatial Intelligence) 기술이 올해 유럽컴퓨터비전학회(ECCV)에서 구글과 애플 등을 제치고 1위를 차지했다고 8일 밝혔다.

아이뉴스24

유럽컴퓨터비전학회(ECCV) 2024에서 1위를 차지한 네이버랩스의 인공지능(AI) 기술 도구인 마스터(MASt3R). [사진=네이버]

<이미지를 클릭하시면 크게 보실 수 있습니다>



ECCV는 이미지, 영상 등 컴퓨터 비전 분야에 특화된 최신 인공지능(AI) 연구 성과를 발표하고 새로운 기술 화두를 제시하는 세계 최고 권위의 학회다. 글로벌 빅테크(대형 IT 기업)를 비롯해 비전 분야 세계 최고 석학들이 참석하는 가운데, 2년 주기로 개최된다. 네이버랩스는 이번 ECCV 2024에서 △공간 정밀화(Map-free visual re-localization) △BOP 챌린지 두 부문에 도전했으며 모두 1위를 차지했다.

공간 정밀화 챌린지는 정밀지도 등이 없는 상황에서도 얼마나 정확하게 측위가 가능한지 겨룬다. 이미지 기반 측위(visual localization)는 일반적으로는 사전에 생성된 3D·HD 지도를 기반으로 측위(Localization)을 수행하는 과정을 거친다. 그러나 재난 또는 공사 현장 등 지도를 생성하거나 미리 준비할 수 없는 상황도 있어 지도 없이 측위하는 기술의 중요성도 높아지고 있는 것으로 알려졌다.

네이버랩스는 이 챌린지에 이미지를 3D로 재구성하는 AI 기술 도구인 '마스터(MASt3R)'를 선보였다. 마스터는 정밀지도가 없는 상황에서도 충분히 정확한 측위가 가능하다는 점을 인정받아 구글, 애플, 메타 등 12개 참가팀 중 압도적인 1위를 차지했다. 마스터는 네이버랩스유럽이 개발한 3D 비전 파운데이션 모델(VFM)인 크로코(CroCo)를 기반으로 만든 더스터(DUSt3R)의 업그레이드 버전이다.

또한 네이버랩스는 BOP(Benchmark for 6D Object Pose Estimation) 챌린지에서도 1위를 차지했다. BOP 챌린지에서는 이미지 내에 있는 물체들의 3차원 회전과 위치를 얼마나 정확히 추정하는지 겨룬다.

네이버랩스가 해당 부문에 제출한 기술 모델은 RGB 이미지만으로 물체의 위치를 가장 정확하게 측위(The Best RGB-Only Method)하고 가장 빠르게 처리(The Best Fast Method)할 수 있다는 평가를 받으며 1위를 차지했다. 지난해에 이어 올해도 이번 챌린지에서 1위를 차지했다. 이 모델 역시 3D 비전 파운데이션 모델 크로코(CroCo)를 기반으로 제작됐다.

석상옥 네이버랩스 대표는 "AI에 이어 새로운 미래 변화를 만들어 낼 공간지능은 네이버랩스 출범 이후 로봇과 자율주행 기술을 발전시켜 오며 꾸준히 준비해 온 분야이자 핵심 경쟁력"이라며 "로봇, 자율주행, 디지털트윈은 물론 이를 지원하는 클라우드 인프라, 제2사옥 '1784'와 같은 핵심 테스트베드, 나아가 중동 등 새로운 글로벌 이정표로도 확장할 수 있도록 연구개발에 더 매진하겠다"고 밝혔다.

한편 네이버랩스 외에 네이버클라우드도 이번 ECCV 2024에서 AI 연구 논문 11편이 게재 승인되는 성과를 거뒀다. AI 모델 제작에 필요한 다량의 이미지·텍스트 데이터를 보다 효과적으로 정제해 양질의 학습 데이터셋을 구축할 수 있는 방법을 제안한 연구, 이미지 인식 모델 성능을 향상시키는 방법을 소개한 연구 등을 발표하며 글로벌 AI 연구자들의 주목을 받았다.

/정유림 기자(2yclever@inews24.com)


[ⓒ 아이뉴스24 무단전재 및 재배포 금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.