‘학습과 데이터 제로' 표방, 즉시 현장 적용 가능… AI 도입 장벽 제거, 제조•물류 등 전 산업 영역 확장 가속화
산업 환경을 반영한 멀티 도메인 평가, 비전 AI 강국인 중국 톱 티어 모델 대비 우수한 성과
최소비용으로 8개월 만에 개발 완료… 90만개 데이터로 1억개 사용한 글로벌 모델과 동등한 성능
ⓒTech42 |
비전 AI 전문기업 슈퍼브에이아이(이하 슈퍼브AI)가 국내 최초로 산업 특화 비전 파운데이션 모델(Vision Foundation Model, 이하 VFM) '제로(ZERO)'를 공개하며 AI 기술 도입의 벽을 허물었음을 선언했다.
24일 서울 여의도 콘래드 호텔에서 열린 기자간담회를 통해 슈퍼브AI는 ‘제로’의 기술적 성과와 비즈니스 전략을 상세히 소개하고, 산업 전반의 AI 도입 장벽을 근본적으로 해소하겠다는 비전을 제시했다.
제로는 대규모 이미지 데이터로 사전 학습된 범용 AI 모델이다. 단 90만개의 데이터와 8개월이라는 짧은 개발 기간만으로 기존 글로벌 1위 모델과 동등한 성능을 구현했다. 복잡한 추가 학습 없이도 다양한 시각적 작업에 적용 가능해, 전 산업군에 즉시 적용 가능하다는 것이 특징이다. ‘추가 학습이 없이 적용할 수 있다’는 의미는 다시 말해 그간 기존 AI 도입 과정에서 필연적으로 수반되던 데이터 구축과 라벨링, 재학습 등의 부담을 없앴다는 것을 뜻한다. 그래서 모델 명도 ‘제로’다.
텍스트 기반의 LLM(대규모 언어 모델)이 언어 처리 분야에서 활용되는 것처럼, 비전 파운데이션 모델은 이미지 인식과 분석 분야에서 제조업 품질 검사, 안전 관제 효율화, 물류 자동화 등 다양한 산업에 적용될 수 있다. 특히 제로의 경우 기존 파운데이션 모델과 비교해 10분의 1 정도의 GPU만을 사용했다는 점은 주목할 만하다.
김현수 대표는 발표에서 “AI 도입 장벽을 허물고, 누구나 쉽게 AI를 활용할 수 있는 환경을 조성하는 것이 슈퍼브AI의 미션”이라며, AI 전문가 부족, 양질의 데이터 확보 어려움, 인프라 미비라는 3대 장애물을 지적했다. 슈퍼브는 이를 해결하기 위해 MLOps(ML옵스) 기반의 '슈퍼브 플랫폼'과 산업별 즉시 활용 가능한 버티컬 솔루션을 제공해 왔으며, 이번 제로 출시로 AI 도입을 저해하는 장벽을 완전히 '제로'로 만들겠다는 비전을 내세웠다.
이날 기자간담회에서는 제로의 구조적 차별성과 산업 활용성, 그리고 생태계 전략까지 전방위적인 발표가 이어졌다. 김현수 대표에 이어 등장한 슈퍼브AI의 차문수 CTO는 제로의 기술적 기조와 성능 검증 결과를 발표했고, 김진회 CBO는 실제 산업에서의 데모 시연과 함께 시장 전략을 소개했다. 이들은 제로가 단순한 기술 제품이 아닌, 산업 혁신의 엔진이자 글로벌 시장에서 한국의 경쟁력을 끌어올릴 핵심 기술이라고 입을 모았다.
슈퍼브AI가 제로를 개발한 이유는?
ⓒTech42 |
'AI도입의 장벽을 허물다'라는 주제로 발표에 나선 김현수 대표는 이날 ‘AI 진입 장벽을 허물어 모든 산업의 혁신을 가속화한다’는 회사의 미션을 강조하며, AI 도입을 가로막는 데이터·인력·인프라 부재 문제를 지적했다. 슈퍼브AI는 복잡한 AI 개발의 모든 과정을 하나의 플랫폼으로 통합한 MLOps 솔루션을 통해 누구나 쉽게 AI를 개발할 수 있도록 지속적으로 지원해 왔다.
“AI를 개발할 때는 당연히 전문가가 필요합니다. 하지만 절대적으로 그 수가 부족하기도 하고 처음 AI를 도입하는 기업, 기존 전통 산업 분야의 경우 AI 개발자를 채용하기 굉장히 어렵습니다. 또 양질의 학습 데이터가 필요한데, AI를 처음 도입하는 기업 입장에서 양질의 데이터를 보유하고 있을 가능성도 낮죠. 기술적 인프라 역시 GPU와 같은 컴퓨팅 자원부터 시작해 데이터를 관리하거나 선별하는 소프트웨어 등에도 비용이 적잖이 필요하고요. 저희는 이런 현실적인 장벽을 허물기 위해 앞서 첫 번째 해결책으로 ML옵스 솔루션을 통해 복잡하고 긴 AI 개발 과정을 효율화, 간편화하는데 노력해 왔죠.”
ⓒTech42 |
ⓒTech42 |
이어 슈퍼브AI가 AI 도입 장벽을 허물기 위해 출시한 두 번째 솔루션은 AI 기술 자체에 접근이 어려운 기업을 위한 '버티컬 솔루션'이었다. 이는 AI를 직접 개발하지 않아도 현장에서 바로 활용할 수 있는 제품군으로, CCTV 기반 영상관제, 화재 감지, 쓰러짐 감지 등 다양한 안전 관제 솔루션을 포함하고 있다. 대표적으로 국내 프로야구장, 발전소, 공항 등에 도입됐으며, 해외에선 도요타가 이를 활용하고 있다. 하지만 김 대표는 그에 만족하지 않았다. “더 높은 목표를 설정하면 어떤 것을 할 수 있을까”를 고민했고 그 답으로 선보인 것이 바로 ‘제로’다.
“어떤 기업보다 빠르고 정확하게 영상 AI를 개발할 수 있는 ML옵스 기술을 보유했고, 다양한 산업에 AI를 도입하며 산업별 AI 도입 전략과 노하우, 심지어 데이터까지 보유했죠. 그럼에도 저희는 ‘어떤 것을 더 할 수 있을까’를 고민했습니다. 그리고 오늘, 그 노력의 정점인 국내 최초 산업용 비전 파운데이션 모델 ‘제로’를 선보이게 됐습니다.”
ⓒTech42 |
김 대표는 제로를 통해 AI 개발 초기 단계에서의 라벨링, 학습, 모델 구축 등을 생략할 수 있다고 강조했다. 김 대표의 말에 따르면 제로는 방대한 산업 데이터 기반으로 미리 학습되어 있기 때문에, 프롬프트만 입력하면 AI가 곧바로 문제를 해결한다. 사용자는 단순한 텍스트를 프롬프트에 입력하거나 예시 이미지만을 제시하는 것으로 원하는 기능을 바로 실행할 수 있다. 그는 이를 '제로 데이터', '제로 학습', '제로 복잡성', '제로 대기 시간', '제로 한계'라는 다섯 가지 키워드로 요약했다.
차세대 VFM ‘제로’의 구조와 성능은 어느 수준?
ⓒTech42 |
이어 'AI 기술 혁신의 새로운 패러다임'을 주제로 발표에 나선 차문수 CTO(Chief Technology Officer, 최고기술책임자)는 기존 비전 AI가 가진 구조적 한계를 지적하며, 제로가 이를 어떻게 돌파했는지를 기술적 설명으로 풀어냈다. 기존 모델은 폐쇄집합(Closed-set) 구조로, 학습하지 않은 객체나 환경에는 대응하지 못했고, 작업 단위마다 별도 AI를 개발해야 했기에 운영 부담이 컸다는 설명이다. 이어 차 CTO는 제로의 기술적 성과를 소개하며, 이 모델이 AI 도입의 새로운 패러다임을 여는 네 가지 핵심 기술을 기반으로 한다고 설명했다.
ⓒTech42 |
먼저 제로샷(Zero-shot) 추론 방식이다. 이는 미리 학습되지 않은 새로운 환경이나 사물 등 처음 보는 객체라도 사전 학습된 정보만으로 인식할 수 있다. AI 도입 시 기업이 겪는 복잡한 데이터 수집이나 모델 재학습의 부담을 크게 줄어든 것이다. 두 번째, 오픈 월드 시스템과 관련해 차 CTO는 “인터페이스의 혁신”이라 했다. 단어를 기반으로 특정 위치나 사물을 인식(Open Vocabulary)하고, 더 나아가 자연어 텍스트에 맞게 사물을 찾는(Referring Expression) 기술이다. 다음 멀티모달(Multi-modal) 프롬프트 기반 사용 방식을 통해 텍스트 명령이나 이미지, 객체 등 다양한 형태의 입력만으로 즉시 작동할 수 있게 했다. 이는 산업 현장에서 변화하는 니즈에 따라 손쉽게 AI가 수행하는 업무를 조절할 수 있는 인터페이스를 제공한다는 점에서 의미가 크다.
ⓒTech42 |
마지막으로 멀티태스크 처리 능력이다. 이를 통해 단일 모델이 객체 탐지, 분류, 세분화 등 복잡한 비전 작업을 동시에 수행할 수 있다. 차 CTO는 이를 ‘유니파이드 모델’이라며 “복잡한 산업 현장 문제를 단일 모델로 해결할 수 있도록 지원한다”고 강조했다.
또 차 CTO는 현재 비전 AI 분야 세계 강국 중국의 모델인 T-Rex2, DINO-X 등이 2000만개에서 1억개 사이의 대규모 데이터셋을 사용한 것과 비교해, 제로는 단 90만개의 데이터셋만으로 동등한 성능을 구현했다는 점을 내세웠다. 이를 통해 글로벌 대표 모델 대비 우위의 성능을 확보했으며, 권위있는 글로벌 비전 AI 학회인 CVPR 2025 챌린지에서 우수한 평가를 얻는 성과도 거뒀다는 것이 차 CTO의 설명이다.
GPU 자원을 10분의 1로 줄이고도 높은 성능을 유지할 수 있었던 배경으로는 자체 ML옵스 플랫폼의 데이터 선별 기술을 꼽았다. 제로는 경량화된 구조로 설계돼 클라우드 API는 물론 엣지 디바이스, FGI 등 다양한 환경에서 실시간 적용이 가능하다. 차 CTO는 "제로는 산업 현장과 가장 가까운 모델이며, 기존 AI 개발과 운영 비용을 획기적으로 줄이는 풀스택 생태계의 중심축"이라고 강조했다.
ⓒTech42 |
실제 제로는 글로벌 기준에서도 손색없는 성능을 갖춘 비전 파운데이션 모델로 주목받고 있다. 메타(Meta)에서 구축한 글로벌 표준 벤치마크인 LVIS (Large Vocabulary Instance Segmentation) 에서 우수한 성과를 기록했으며, 특히 예시 이미지를 기반으로 다양한 객체를 탐지하는 ‘시각적 명령어 기반 객체 탐지(Visual-I AP)’ 항목에서 세계 정상급 수준의 성능을 입증했다. 사용자가 예시 이미지를 입력하면 AI가 학습 없이도 다양한 사물이나 패턴을 실시간으로 인식할 수 있는지를 평가해, 불량품 판별, 다품종 제품 식별, 이물질 검출 등 산업 현장에서 반복적으로 발생하는 과업에 특히 유용하며, 제로는 별도의 추가 학습 없이 바로 수행할 수 있는 실용적 AI로서 경쟁력을 보여주고 있다.
차 CTO에 따르면 제로는 단순히 벤치마크에서 높은 수치를 기록한 것을 넘어 산업 현장 중심의 실질적인 활용 가능성에서도 강점을 보였다. 제로의 산업 현장에 특화된 성능을 평가하기 위해 슈퍼브AI는 자체 멀티 도메인 산업 특화 데이터셋(Multi-Domain Dataset) 기반의 벤치마크를 새롭게 구축하고 37가지 산업 분야에서 평가를 진행했다. 텍스트 명령으로 탐지(텍스트 AP), 예시 이미지로 탐지(시각 AP), 두 방식 통합(통합 AP) 지표 모두에서 글로벌 최상위 모델들을 뛰어넘는 성능을 기록하며, 제조, 물류, 보안 관제 등 다양한 산업 환경에 대한 즉시 적용성을 입증한 것이다.
AI 도입의 새로운 표준, '제로 인사이드' 비전
ⓒTech42 |
이날 마지막 발표에 나선 김진회 CBO(Chief Business Officer, 최고비즈니스책임자)는 ‘제로는 단순한 기술 제품을 넘어, 모든 산업에 적용 가능한 새로운 비즈니스 엔진’이라며 ‘The Business of ZERO’를 주제로 향후 사업 전략과 시장 확장 비전을 제시했다.
김 CBO는 제로가 기존 AI 도입 방식의 시간·비용·전문성 장벽을 일거에 무너뜨렸다고 강조했다. 예를 들어 제조 결함 검출, 수량 카운팅, 매대 진열 분석, 영상 관제 등 다양한 산업 현장에서 단 한 장의 이미지나 단어 프롬프트만으로 AI가 즉시 작동하는 데모 영상을 통해 그 실효성을 보여줬다. 특히 수백 개의 CCTV 영상에서도 특정 객체를 실시간으로 트래킹하고 분석하는 기능은 AI 기술의 현장 활용도를 극적으로 증명했다.
ⓒTech42 |
김 CBO는 "PoC 비용이 제로이고, AI 전문가 없이도 곧바로 테스트가 가능하다"며, AWS 등 글로벌 플랫폼에서도 클릭 몇 번으로 사용할 수 있는 생태계 전략을 설명하기도 했다. 또한 제로의 활용 가능성을 실제 산업 현장 중심의 데모를 시연하며, ‘AI는 더 이상 복잡한 프로젝트가 아니라, 아이디어 하나만으로 즉시 실행할 수 있는 실용 도구가 되어야 한다’고 강조했다.
제로를 통해 겨냥하는 시장 확장 전략도 주목을 받았다. 김 CBO는 제로가 겨냥하는 시장을 기존 컴퓨터 비전 시장(약 20조 원)보다 10배 큰 200조 원 규모의 영상 기반 산업 전체로 확대 설정했다. 또한 "AI는 일부 기업만의 기술이 아닌, 모든 산업이 활용하는 범용 도구가 돼야 한다"며 "'제로'는 향후 '제로 인사이드'라는 비전 아래 제로가 스마트팩토리, 관제 시스템, 리테일 솔루션 등에 자연스럽게 내장돼 기업 경쟁력을 끌어올리는 핵심 인프라가 될 것"이라고 강조했다.
“새로운 시장을 창조하는 것을 넘어 저희가 꿈꾸는 궁극적인 미래는 AI 인사이드입니다. PC에 붙어 있는 인텔 인사이드가 PC의 성능을 보증하는 신뢰의 상징이었던 것처럼 저희는 제론 인사이드가 모든 시각적 지능의 표준이 되기를 희망하고 있습니다. 산업 현장에서 매일 마주하는 스마트 팩토리 시스템, 안전을 책임지고 있는 통합 관제 시스템, 그리고 보안 카메라에 이르기까지 미래에 여러분은 제로라는 이름을 직접 보지는 못하실 수 있습니다. 하지만 모든 것이 더 똑똑해지고 더 편리해지고, 더 안전해졌음을 느끼실 수 있을 겁니다. 제로는 눈에 띄는 주인공이 아닌 모든 위대한 혁신 뒤에 있는 보이지 않는 핵심 부품이 되고자 합니다. 이것이 저희가 그리는 제로의 최종적인 모습입니다.”
그러면서 김 CBO는 “제로를 통해 전문가의 지식이 곧바로 강력한 AI 에이전트가 될 수 있다”며 "제로는 전문가의 머리 속 지식을 실제 작동하는 AI로 바꿔주는 가장 강력한 도구가 될 것"이라고 말했다.
ⓒTech42 |
한편 2018년 설립된 슈퍼브AI는 삼성, LG전자, 퀄컴, 현대차, SK텔레콤 등 100개 이상의 기업에 비전 AI 솔루션을 제공하며 490억원의 투자를 유치한 국내 대표 비전 AI 전문 기업이다. 한국, 미국, 일본 3개국에 진출해 있으며 31건의 특허를 보유하고 있다. AWS '2024 올해의 라이징 파트너'로 선정됐으며, 세계 최대 비전 AI 학회 2025 CVPR 챌린지서 준우승을 하는 저력을 보여주었다. 주력 제품 중 하나인 슈퍼브 플랫폼은 API 구독 모델을 도입해 개발자가 몇 줄의 코드만으로 비전 AI를 구현할 수 있도록 했다.
국내·외 AI 기술 기업들이 저마다 혁신적인 솔루션을 선보이는 상황에서 이제 ‘제로’를 통해 새로운 미래를 만들어가고 있는 슈퍼브AI의 전략이 과연 통할 것인지, 귀추가 주목된다.
황정호 기자
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지
