컨텐츠 바로가기

11.07 (목)

[마루에서 만난 사람] 민동찬 브이몬스터 대표 “경량화한 실시간 대화형 AI 휴먼 솔루션을 개발했습니다”

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
‘AI 휴먼과의 소통을 가속화하겠다’는 비전으로 카이스트(KAIST) AI 연구원에서 창업가로 변신
자체 기술에 생성형 AI 모델 결합, 경량화에 성공한 AI 휴먼 솔루션 선보여… 가격 및 반응속도 자신감
교육, 추모 분야를 비롯해 세일즈 등 다양한 영역에 AI 휴먼 솔루션 접목 시도, 대중화된 미래 그려
테크42

ⓒTech42

<이미지를 클릭하시면 크게 보실 수 있습니다>


각 분야에서 생성형 AI 적용을 통한 혁신이 진행되고 있다. AI 휴먼 분야도 예외가 아니다. 특히 생성형 AI가 텍스트와 이미지를 넘어 영상, 음성 기반 대화형 서비스로 진화하는 상황에서 AI 휴먼 역시 기술적 진보를 거듭할 것으로 전망되고 있다.

실제로 그러한 시도는 이미 AI 휴먼 업계에서 진행 중이다. 기존 AI 휴먼 솔루션이 기술적 한계로 인해 미리 설정하고 입력한 정보를 일방향으로 전달하는 영상 제작에만 사용됐다면, 이제는 양방향 소통이 가능한 대화형 AI 휴먼 개발이 가능해진 것이다. 이는 생성형 AI 기반 서비스의 등장과 함께 양방향 소통을 위한 기술적 돌파구가 마련된 덕분이다. 더구나 기존 수분에서 수시간이 소요됐던 AI 휴먼 생성 시간 역시 실시간으로 가능해 졌다.

지난해 4월 카이스트(KAIST) AI 연구원 출신의 민동찬 대표가 창업한 ‘브이몬스터’는 바로 이러한 기술력을 기반으로 AI 휴먼 서비스를 선보였고, 즉각적인 시장의 반응을 얻고 있다.

브이몬스터의 AI 휴먼 서비스는 기존 느린 생성 속도와 높은 운영 비용의 한계를 극복하며 주목을 받았다. 비결은 자체 개발한 경량화 알고리즘을 적용한 온디바이스 기술이다. GPU 클라우드를 사용하지 않고 작은 모델로 AI 휴먼을 생성할 수 있고 챗GPT 등과 연동해 실시간으로 대화가 가능하다.

브이몬스터에 따르면 포토 AI 휴먼의 경우 사진 1장, 음성 녹음 1문장의 데이터만 있으면 제작이 가능하다. 스튜디오 AI 휴먼의 경우는 3시간의 스튜디오 촬영 데이터만 있으면 된다. 기존 서비스가 스튜디오 촬영 20시간 이상의 데이터를 필요로 했던 것에 비하면 상당한 경쟁력이다. 온디바이스는 물론 클라우드를 통한 서비스도 가능하며 AI 휴먼의 해상도와 자연스러움, 입모양 싱크 역시 기존 서비스들을 넘어섰다는 평가를 받고 있다.

이에 테크42는 민동찬 대표를 만나 브이몬스터 창업 배경과 AI 휴먼의 기술적 차별점, 향후 계획 등을 들어봤다.

창업과 함께 시드 투자 유치, 딥테크 팁스 선정까지

테크42

ⓒTech42

<이미지를 클릭하시면 크게 보실 수 있습니다>


민동찬 대표는 카이스트에서 전기전자 & 기술경영 학사를 졸업하고 AI 석사와 박사과정을 밟으며 연구원으로서 주요 AI 학회에 음성, 영상, 생성 AI 관련 논문 8편을 발표한 전문가다. 음성 합성과 영상 합성 지식재산권 2권도 등록돼 있다. 공동창업자인 이재웅 이사 역시 카이스트 AI 연구원 출신이다. 평생 연구자의 길을 갈 것이라고 생각했던 두 사람이 창업을 결심한 이유는 뭘까? 최근 브이몬스터가 새롭게 오피스를 마련한 아산나눔재단의 창업가 플랫폼, 마루180에서 만난 민 대표는 “충동적인 도전이었다”며 말문을 열었다.

“주로 음성과 영상 생성 분야를 연구해왔어요. 평생 연구자로 살 것이라 생각했는데, 어느 순간부터 생성이라는 분야가 분명 사람들에게 놀라운 가치를 줄 수 있을 것 같다는 생각이 들더군요. 생성 AI가 지금처럼 주목받기 이전부터 그런 생각을 했어요. 그러다가 단지 연구로 끝나는 것이 아닌, 애플리케이션화해 사람들에게 실질적으로 생성 AI의 가치를 체험할 수 있도록 하고 싶다는 생각이 떠나지 않았어요. 그렇게 이재웅 이사와 의기투합해 시작하게 됐죠(웃음).”

그렇게 설립한 ‘브이몬스터’ 사명의 ‘브이’는 가상을 의미하는 ‘Virtual’을 뜻한다. 민 대표는 “가상의 세계에서 몬스터와 같이 재미있게 노는 존재가 되고 싶다는 의미”라며 사명을 짓게 된 배경을 설명했다.

“AI 휴먼이라는 기술 자체는 한편으로 윤리적인 이슈와 엮인 부분도 있는 상황이예요. 그래서 너무 기술적인 접근 보다는 사람들에게 재미있고 편안하게 접근하길 바라는 마음에서 게임 회사와 같이 조금은 재미있는 사명으로 가야겠다고 생각했죠.”

연구자들이 의기투합해 조금은 충동적으로 시작한 첫 창업의 성과는 기대 이상이었다. 창업과 함께 시드 투자를 유치했고 바로 몇 개월 후 중소벤처기업부로부터 딥테크 팁스(TIP)에 선정되며 초기 자금을 확보할 수 있었다. 모두 서비스 개발이 진행 중인 상황에서 얻은 성과들이다.

실질적으로 AI 휴먼 실시간 영상채팅 서비스 개발이 완료된 것은 지난 2월 무렵이다. 여기에 플랫폼을 구축하고 SDK(소프트웨어 개발 키트, 개발자가 다른 프로그램에 추가하거나 연결해 커스텀 앱을 제작할 수 있는 기능을 제공하는 도구)화한 것이 지난 6월의 일이다. SDK를 제공한다는 것은 브이몬스터의 AI 휴먼 솔루션은 다양한 분야에 적용이 가능하다는 의미기도 하다. 그 사이 함께하는 멤버들 역시 8명으로 늘어났다. 민 대표는 “숨가쁘게 달려온 지난 시간을 뒤로하고 이제 내년을 중비하는 시기에 마루180에 오피스를 마련한 것은 브이몬스터로서 여러 모로 도움이 되고 있다”며 말을 이어갔다.

“이제 마루180에 온지 한달 정도지만 다양한 네트워킹 기회를 통해 정말 많은 도움을 얻고 있어요. 특히 첫 창업인 저희 입장에서 스타트업계에 초년생이라고 할 수 있는데, 여러 대표님들의 경험을 들으면서 각 산업 분야에 대해서도 파악하게 되고, 향후 스케일업 등 스타트업이 거쳐야 할 과정에 대해서도 간접경험을 할 수 있어 큰 도움이 되고 있죠.”

핵심은 경량화, 시간과 비용 문제 해결

테크42

ⓒTech42

<이미지를 클릭하시면 크게 보실 수 있습니다>


시드 투자와 딥테크 팁스 선정 과정에서 브이몬스터 AI 휴먼 기술이 가능성을 인정받은 것은 여러 이유가 있지만, 민 대표는 ‘경량화’를 우선 꼽았다. 이미 수년 전부터 AI 휴먼을 비롯해 생성형 모델 기반 기술이 다양한 산업군에서 활용되고 있지만, 늘 한계로 지적된 부분이 고비용과 대규모 모델 운영의 어려움이었다. 브이몬스터는 이 문제를 해결하는 경량화 기술을 제시한 것이다.

“기존 AI 기술의 문제 해결을 위해 대두된 기술이 경량화였어요. 저희는 그러한 생성 모델 경량화에 기술적인 강점을 가지고 있었죠. 특히 AI 휴먼 분야에 특화된 경량화 기술이라고 할 수 있습니다. 그것이 기존 AI 휴먼 기술과 다른 저희만의 경쟁력이라고 할 수 있죠.”

민 대표의 이야기를 들으며 한편으로 의문이 들기도 했다. 만약 ‘모든 AI 휴먼 기술을 뛰어 넘는 영상 생성 AI가 등장한다면…’ 없는 이야기도 아닌 것이 이미 오픈AI는 올해 2월 TTV(Text to Video) 기술이 적용된 동영상 생성 AI ‘소라’를 공개했기 때문이다. 아직 상용화 전이지만, 챗GPT 등장 당시 AI 업계가 경험한 충격파를 생각하면 우려되는 부분이 아닐 수 없다. 이에 대해 민 대표는 “그런 우려는 대부분의 AI 스타트업이 가지고 있을 것”이라면서도 차별화를 강조했다.

“빅테크 기업들이 진행하는 AI 기술은 저희 같은 스타트업과는 방향성이 다르다고 생각해요. 빅테크 AI 기술 트렌드는 사실 모델 사이즈를 키우는데 초점이 맞춰져 있으니까요. 더 큰 모델이 더 많은 일을 잘 할 수 있게 하는, 퀄리티를 높이는 것에 집중하고 있죠. 그런 기술은 엄청난 비용이 소요되고 규모의 경제를 활성화 시킬 수 있을 때 장점이 있는 거라고 봐요. 반면 저희는 특정한 분야를 세그먼트해 더 작고 특화된 모델을 만드는데 집중하고 있어요. 비용적으로는 물론 운영적인 부분에서 경쟁력을 가져 가겠다는 방향성을 설정하고 있는 거죠. 그런 방향성이 빅테크의 기술적 트렌드와 별개로 저희 같은 스타트업이 차별성을 가져갈 수 있는 방법이라고 생각해요.”

테크42

ⓒTech42

<이미지를 클릭하시면 크게 보실 수 있습니다>


이에 브이몬스터는 독자적인 경량화 알고리즘을 바탕으로 작은 모델 사이즈 대비 고퀄리티를 달성한 AI 휴먼을 다양한 시장에 적용하며 PMF(시장적합도)를 확인하고 있다. 지난해 12월 온라인 추모 서비스 전문 기업 다큐다와 AI 휴먼 기술을 활용한 공동 서비스 개발을 위한 사업 협약 체결, 올 8월 YBM과 AI 휴먼 기반 영어교육 서비스 개발을 위한 업무협약이 그러한 노력의 일환이다. 특히 브이몬스터는 지난 12월 프로야구 은퇴선수협회인 일구회의 ‘2023년 뉴트리디데이 일구상 시상식’에서 짧은 시간 내에 故 최동원 선수의 AI 휴먼을 선보이며 주목을 받았다. 민 대표는 “기존 AI 휴먼과는 전혀 다른 방식”이라며 말을 이어갔다.

“가장 큰 차이 점은 챗GPT의 등장 이후라는 거예요. 이전까지는 그야말로 일방향 정보 전달을 위한 AI 휴먼이 대부분이었고, 사람을 대체하는 것은 한계가 있었어요. 하지만 현재는 AI와 소통하는 시대가 왔고, 챗GPT 등장 이후 AI 휴먼은 정말 사람과 소통하는 방식의 인터페이스로 작용하고 있어요. 물론 아직 신규 사업이고 너무 초기 제품이기에 저희는 다양한 산업 분야의 고객사에 저희 기술을 제공하며 AI 휴먼이 줄 수 있는 새로운 가치를 찾고 있어요. 우선 시도한 분야가 교육과 추모 분야죠. 양방향 소통이 되며 인식이 달라지고 있다는 것이 저희 생각입니다.”

급성장하는 AI 에이전트 시장, 선택과 집중이 필요해

테크42

ⓒTech42

<이미지를 클릭하시면 크게 보실 수 있습니다>


민 대표는 “최근 거대 언어모델 기반의 AI 에이전트 시장이 급성장하고 있다”며 “일부 산업 군에 텍스트 기반을 넘어 영상 인터페이스가 필요한 수요가 생겨나기 시작하고 있다”고 강조했다. 브이몬스터가 주목한 분야는 앞서 언급된 교육과 추모 분야다. 민 대표는 재차 그 이유를 설명했다.

“교육 분야는 아무래도 학생들 교육을 채팅으로 하는 것에 한계가 있을 수밖에 없어요. 선생님의 비주얼이 필요해지는 거죠. 디지털 추모 분야에서도 당연히 돌아가신 고인의 얼굴이 나오는 것이 중요해지고 있고요. 가령 AI 휴먼 원어민 영어 선생님과 영어 회화를 공부하는 경험, 돌아가신 분들의 영정 사진을 기반으로 간단한 추모 영상을 제작하는 방식으로 서비스를 시작하고 있습니다.”

교육과 추모 분야를 비롯해 브이몬스터가 주목하는 또 다른 분야는 세일즈 영역이다. 이미 세일즈를 담당하는 AI 휴먼 제작을 계획 중이다. 그렇다면 브이몬스터가 지향하는 것은 SDK를 배포해 범용적인 서비스로서 AI 휴먼이 사용되는 것일까? 민 대표의 이야기를 좀 더 들어볼 필요가 있다.

“현재는 다양한 산업 군에서 AI 휴먼이 어떤 가치를 줄 수 있는지를 터칭해 보고 있는 단계라고 봐주시면 될 거 같아요. 조금더 중장기적인 플랜을 말씀드리자면, 이후에는 점차 산업군을 줄여 특정 산업군에 집중하는 전략을 생각하고 있어요. 아직은 그 특정 산업군이 무엇일지 확실하진 않지만, 현재와 같이 테스트를 진행한 후에는 점점 더 좁혀 나갈 수 있을 거라고 보고 있습니다.”

테크42

ⓒTech42

<이미지를 클릭하시면 크게 보실 수 있습니다>


테스트와 동시에 브이몬스터 팀은 지속적이 R&D(연구개발)을 통해 AI 휴먼 기술의 고도화를 진행 중이다. 전체 인력의 대부분이 개발자로 구성돼 있는 것도 그 때문이다. 이와 동시에 민 대표의 고민은 빠른 서비스화다. 이는 ‘AI 휴먼과의 소통을 가속화하겠다’는 비전을 설정한 이유와도 맞닿아 있다. 인터뷰 말미, 민 대표는 “테슬라를 벤치마킹하고 있다”며 향후 계획을 털어놨다.

“올해까지는 다양한 분야에 AI 휴먼 적용 가능성을 터칭해보고 그 결과를 내년에 적용할 생각이에요. 그 과정에서 프리 A 투자 유치도 준비 중입니다. 특정 산업군이 정해졌을 때 좀 더 공격적인 적용과 확장을 하려면 투자가 필요하니까요. 저희 비전은 ‘AI 휴먼과의 소통을 가속화하겠다’는 거예요. 마인드적으로 테슬라의 ‘지속 가능한 에너지로의 전 세계적 전환을 가속화한다’는 미션을 벤치마킹했죠. 테슬라가 전기자동차를 꾸준히 발전시키며 대중화한 것처럼 저희는 AI 휴먼이 대중화되며 사람들 옆에서 가치를 주고 의미있는 관계를 형성하는 미래를 꿈꾸고 있어요. 창업 동기는 단순히 제 연구를 다른 사람들도 경험하고 활용하게 하고 싶는 바람이었지만, 계속 하다 보니 이제는 입증을 하고 싶은 욕심이 생기네요(웃음).”

황정호 기자

저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.