컨텐츠로 건너뛰기
검색
아이뉴스24 언론사 이미지

[K-AI 이노베이터⑥] 트웰브랩스 "전 세계 데이터 80%가 영상...영상 AI 분야의 챗GPT 될 것"

아이뉴스24 정유림
원문보기

[K-AI 이노베이터⑥] 트웰브랩스 "전 세계 데이터 80%가 영상...영상 AI 분야의 챗GPT 될 것"

속보
코스피 '5,000 시대 개막'…증시 새 역사
이재성 트웰브랩스 대표⋯2021년 창업한 영상 AI 기술 기업
"가장 많지만 제대로 활용 못하는 영상⋯시공간 흐름 반영해 연속적 데이터로 영상 해석"
"'피지컬 AI' 시대, 영상 AI 기술이 핵심 기여⋯영상 분야의 '챗GPT' 같은 범용 도구 공략"
인공지능(AI)이 '기술 성과'를 넘어 '산업 혁신'을 이끄는 시대에 K-AI 혁신의 주역들을 만나본다. 태생부터 AI 혁신을 목표로 한 'K-AI 이노베이터'다. 이들의 기술 혁신과 미래 비전을 심층적으로 살펴봄으로써 대한민국 AI 산업이 나아갈 방향을 제시한다.[편집자]

[아이뉴스24 정유림 기자] 글(텍스트)이나 사진(이미지)을 다루는 인공지능(AI)에서 나아가 더 복합적인 형태의 영상에 일찌감치 주목해 존재감을 각인시킨 기업이 있다. 트웰브랩스가 그 주인공이다. 창업 초기부터 기술력을 인정받았고 '러브콜'이 잇따르는 이 회사는 누적 투자금만 약 1500억원에 이른다. 피지컬 AI 시대에 영상 기술의 필요성이 커지면서 트웰브랩스의 행보도 빨라지고 있다.

이재성 트웰브랩스 대표 [사진=트웰브랩스]

이재성 트웰브랩스 대표 [사진=트웰브랩스]



"전 세계 데이터 대부분이 영상⋯가장 어렵지만 잠재력도 큰 영상에 주목"



이재성 트웰브랩스 대표는 아이뉴스24와 인터뷰에서 "인생의 첫 기억을 생각해 본다고 하면 단어가 아니라 장면이 떠오를 것"이라며 "사람처럼 AI도 세상을 이해하기 위해서는 언어보다 시각이 더 효과적이라고 생각했고 AI에 있어 영상은 가장 어렵지만 동시에 가장 큰 잠재력을 가진 데이터라고 봤다"고 했다.

그는 전 세계 데이터의 약 80%가 영상 형태임에도 대부분은 검색이 안 되고 제대로 활용되지 못하고 있는 점을 주목했다. "영상과 AI를 연결하는 인터페이스가 없었고, 개발자 입장에서 이것은 엄청난 기회"였던 것이다.

1994년생인 이 대표는 창업 전 사이버작전사령부에서 데이터 사이언티스트로 근무하면서 AI 기반 사이버위협정보 체계와 관련한 연구개발을 했다. 군 복무 당시 만난 인연으로 2021년 창업한 것이 트웰브랩스다. 미국 실리콘밸리와 한국 서울 사무소를 동시에 운영하고 있다.

이 대표는 "(조직이) 미국과 한국에서 동시에 운영되다 보니 불필요한 회의로 메우기보다 명확한 오너십으로 해결한다"며 "각자가 맡은 영역에서 자율적으로 의사결정을 내릴 수 있도록 권한을 부여하고 비동기 커뮤니케이션을 효과적으로 활용하려고 한다"고 했다.


조직원들의 자율적 의사결정이 효과를 발휘하려면 회사의 가치도 적극 공유돼야 한다. 이 대표는 "기술이 '무엇(What)'을 할 수 있는지 보다 '왜(Why)' 그 일을 해야 하는지에 대한 고찰을 놓치지 않으려고 한다"며 "우리 기술이 만들어 낼 미래에 대해 조직원들과 자주 이야기를 나누며 기술 발전이 궁극적으로 사람들에게 더 나은 가치를 제공해야 한다는 점을 공유한다"고 했다.

어느덧 창업 6년차에 접어들었지만 항상 순탄했던 건 아니다. 미국 시장에서 한국인 창업자에 대한 선입견을 극복해야 했고, 영상 AI 모델 개발에 방대한 컴퓨팅 파워와 안정적인 인프라가 필요한데 초기에 이를 확보하는 과정도 쉽지 않았다. 하지만 그는 "기술 데모를 통해 실력으로 증명하는 방식을 택했고 결과적으로 고객들의 확신을 얻을 수 있었는데 이런 도전들이 우리를 더 강하게 만들었다"고 회고했다.

"자율주행 시스템 효과적으로 작동하려면⋯'피지컬 AI' 시대 산업 발전 기여"



트웰브랩스의 경쟁력은 영상 AI 모델의 차별성이다. 이 대표는 "현존하는 멀티모달(여러 가지 형태의 데이터를 통합적으로 이해하고 처리) 거대언어모델(LLM)들은 영상을 짧게 쪼개거나 정적 프레임 수준의 처리에 머물러 있어 고차원적 맥락을 이해하는 데는 한계가 있다"며 "트웰브랩스는 영상을 정적 프레임이나 단일 모달로 축소하지 않고 시공간 흐름을 반영한 연속적 데이터로 해석하는 '비디오-네이티브(Video-native)' 방식을 적용한다"고 설명했다.


영상 산업 현장에서도 트웰브랩스 기술을 적극 활용하고 있다. 방송사나 온라인 동영상 스트리밍(OTT) 서비스가 수만 시간의 영상 아카이브에서 특정 장면을 검색하는 것이 대표적이다. 캐나다의 스포츠·엔터테인먼트 기업 메이플 리프 스포츠 앤드 엔터테인먼트(MLSE)는 트웰브랩스의 기술을 활용해 과거 하이라이트 영상을 찾는 시간을 16시간에서 9분으로 줄였다.

[사진=트웰브랩스]

[사진=트웰브랩스]



트웰브랩스는 미디어·엔터테인먼트 분야 외에도 국방을 비롯한 공공 영역과 피지컬 AI 부문에 관심을 갖고 있다. 지난해 11월 LIG넥스원과 업무협약을 맺은 후 자율형 군집 체계(드론)를 포함한 감시·정찰 자산에서 생성되는 영상 데이터를 기반으로 상황 인식과 대응을 돕는 영상 이해 기술을 공동 검토·개발하고 있다.

이 대표는 "로봇이나 드론, 자율주행 시스템이 안전하고 효과적으로 작동하려면 실시간으로 주변 환경을 인식하고 상황을 판단해야 하는데 회사의 기술이 이를 뒷받침할 수 있을 것"이라며 "한국은 제조, 로보틱스 분야에서 강점을 가져 물리적 환경에서 작동하는 시스템과 AI 인지 기술을 결합하는 '피지컬 AI' 시대에 큰 기회가 있다고 보고 있고 회사의 영상 AI 기술이 이 산업 발전에 핵심적으로 기여할 수 있다고 확신한다"고 강조했다.


"韓, 아시아태평양(APAC) 확장 거점으로⋯'모든 기계가 영상을 사람처럼 이해하는 시대'에 기본 인프라로"



트웰브랩스는 영상 분야에 오픈AI의 대화형 AI 서비스 챗GPT와 같은 범용 도구가 아직 없는 점에 주목해 '영상 AI 에이전트'를 개발한다는 목표다. 이 대표는 "하나의 챗 인터페이스를 통해 대규모 영상 데이터에 접근하며 원하는 장면을 검색하고 영상 내용 기반 보고서 자동 생성, '엔드투엔드(처음부터 끝까지)' 편집 자동화, 의사결정 지원까지 돕는 형태를 구상 중"이라고 했다.

AI 모델 고도화 뿐 아니라 아마존(AWS) 베드록을 통한 엔터프라이즈 고객 확대, B2G(기업-정부 간 거래)·B2B(기업 간 거래) 사업 확산, 피지컬 AI와 국방 분야 진출 등 할 일이 많다. 미국 외에도 한국을 아시아태평양(APAC) 본부로 삼아 아시아 시장도 진출해야 한다.

이 대표는 "중장기적으로는 '모든 기계가 영상을 사람처럼 이해하는 시대의 기본 인프라'가 되는 것을 목표로 한다"며 "글로벌 멀티모달 AI 플랫폼·에이전트 생태계를 확장하고 산업 다각화(미디어·보안·리테일 등)를 추진할 계획"이라며 포부를 밝혔다.

◇이재성 트웰브랩스 대표는? 이재성 대표는 미국 UC버클리대학교 컴퓨터과학과(EECS)를 졸업했으며 2021년 트웰브랩스를 창업했다. 창업 초기부터 국제 컴퓨터 비전 학술대회(ICCV)의 영상·언어 이해 평가(VALUE Challenge) 영상 검색 부문에서 1위를 하는 등 기술력을 인정받았다. 그가 이끄는 트웰브랩스는 매년 전 세계에서 가장 혁신적인 인공지능(AI) 스타트업 100곳을 선정하는 CB인사이트의 글로벌 100대 AI 스타트업에 2022년부터 4년 연속 선정됐다.
/정유림 기자(2yclever@inews24.com)


[ⓒ 아이뉴스24 무단전재 및 재배포 금지]