컨텐츠 바로가기

04.26 (금)

[차세대 유니콘]⑭ 얼룩말 ‘세로’ 패러디 이미지 3000건… 정승환 라이언로켓 대표 “생성 AI로 비디오 제작하는 시대 온다”

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
조선비즈

라이언로켓의 '스포키'에 올라온 얼룩말 '세로'의 이미지들./스포키 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>



지난 23일 서울 어린이대공원에서 탈출했던 얼룩말 ‘세로’는 슈퍼스타가 됐다. 세로의 엄마·아빠 얼룩말이 최근 잇따라 세상을 떠나 홀로 외롭게 지냈고, 이에 울타리를 부수고 탈출했다는 이야기가 사람들의 안타까움을 자아냈던 것이다. 소셜미디어(SNS)에서는 세로의 행복을 바라는 사람들이 각종 패러디 이미지를 만들어 공유했다. 이 가운데 생성 인공지능(AI) 스타트업 ‘라이언로켓’이 주목받고 있다.

라이언로켓이 지난 8일 오픈베타로 출시한 ‘스포키’라는 플랫폼은 사용자가 텍스트를 입력하면 고품질 이미지로 만들어준다. 다른 사용자가 만들어놓은 이미지를 클릭하면 어떤 텍스트를 입력해서 이미지가 생성됐는지 볼 수 있다. 기존에 생성된 프롬프트가 모두 공유되는 것이다. 텍스트를 일부만 수정해서 비슷한 화풍의 또 다른 이미지를 만들어낼 수도 있다. 사이트에서 보이는 이미지는 전부 사용자들이 만든 것으로, 사용자들의 반응과 좋아요 순에 따라 상위에 노출된다.

스포키에서 세로 패러디 이미지는 하루 만에 1250건, 지금까지 3000여건이 만들어졌다. 스포키에 ‘세로의 꿈’을 검색하면 세로가 UN에서 연설을 하는 모습, 기타 공연을 하는 모습, 유니콘처럼 날아다니는 모습, 돈다발에 파묻힌 모습 등을 확인할 수 있다. 스포키는 세로 패러디물 이외에도 각종 커뮤니티와 SNS를 통해 입소문을 타면서 출시 일주일 만에 14만건, 지금까지 36만건이 넘는 결과물이 생성됐다.

지난 22일 서울 중구 을지로에 있는 라이언로켓 사무실에서 정승환 대표(33)를 만났다. 정 대표는 한양대 공대를 졸업하기 직전인 2019년 2명의 친구와 함께 시각장애인을 위한 오디오북을 제작한 것을 계기로 라이언로켓을 세웠다. 초창기에는 딥러닝 기반 음성 기술로 AI가 특정 사람의 목소리로 문장을 읽는 텍스트 음성 변환 기술을 개발했다.

창업 2년 만인 2021년에는 미국 포브스로부터 ‘아시아 30세 이하 리더’에 선정됐다. 하지만 시작부터 순조로웠던 것은 아니다. 정 대표는 “라이언로켓을 창업할 당시 그래픽처리장치(GPU) 가격은 학생들이 살 수 있는 금액이 아니었다”면서 “3명이 만원씩 모아서 하루 임대해서 쓰고 돌려주는 방식으로 겨우 일을 진행했다”고 했다.

그러면서 “도저히 안 되겠다 싶어 공모전 10개를 나갔는데 9개에서 1, 2등을 했다”며 “상금을 모아 1000만원짜리 GPU를 사서 본격적으로 연구를 하게 됐다”고 했다. 그는 “초기에는 음성 데이터가 없으니 3명이서 직접 녹음을 했다”면서 “개발을 하면 할수록 좋은 목소리로 오디오북을 만들고 싶어서 서혜정 성우 강연장에 무작정 찾아가 목소리를 녹음해달라고 부탁했다. 그때 성우님께서 흔쾌히 받아주셨고 다른 분들을 소개도 해주셔서 감사하게 생각한다”고 했다.

정 대표는 처음에는 음성 생성 기술 위주로 사업을 진행했다. 서혜정 성우 이외에도 이병헌, 한지민 배우 등과 함께 시각장애인용 책을 제작해 기부했다. 2020년 MBC 총선 개표 방송에도 라이언로켓의 기술이 쓰였다. 대선 후보가 나와서 말을 할 때 AI 음성을 씌운 것이다. 이후 이미지, 얼굴 생성 쪽으로 개발 방향을 넓혔다. 가상 얼굴, 가상 입모양 생성 등 텍스트를 치면 AI 휴먼이 나와 말을 하는 방식이었다.

라이언로켓은 정부 지원을 받아 개발에 속도가 붙었고, 엔젤 투자, 시드 투자, 프리A를 거쳐 시리즈 A 단계까지 누적 투자 77억원을 받았다. 현재 라이언로켓은 직원 수가 35명까지 늘었고, 함께 창업했던 박준영 이사는 데이터파이프라인, 문용준 이사는 AI 파트를 담당하고 있다. 최근에는 최고연구책임자(CRO)로 제홍모 전 스트라드비젼 최고기술책임자(CTO)를 영입하기도 했다.

정 대표는 “사용자들이 스포키에 폭발적인 반응을 보인 것도 생성 AI에 대한 관심이 반영된 것이라고 생각한다”며 “스포키를 보다 고도화해 올해 상반기 안에 해외 시장에 선보이는 게 목표다”라고 했다. 기능을 다양화하고 사용자들이 원하는 화풍, 구도, 스타일을 더 세세하게 설정해 정교한 결과물을 낼 수 있도록 하겠다는 것이다.

조선비즈

스포키 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>



그는 텍스트를 입력해 이미지를 생성(TTI·Text to Image)하는 단계를 넘어 비디오를 구현하는 기술도 개발하고 있다. 정 대표는 “최근 생성 AI 붐이 일면서 미래가 많이 앞당겨졌다고 생각한다”며 “초거대 모델이 등장하면서 속도가 정말 빨라졌다. 지금까지 AI 뇌의 크기가 10이라고 한다면, 갑자기 10만짜리가 나타나는 수준의 변화로 느껴진다”고 했다. 그러면서 “이와 관련된 경제 효과는 예측하기도 불가능한 수준이고 모바일 이상의 혁신이 될 수 있다고 본다”며 “챗GPT 같은 언어 모델 붐에 이어 이미지, 비디오 붐이 오고 있다. 미국도 한국도 시점의 차이는 있지만 똑같은 흐름이다”라고 말했다.

정 대표는 “텍스트를 입력했을 때 비디오를 얼마나 빨리 만드느냐보다는 얼마나 정교하게 만들지, 품질에 집중하고 있다. 애니메이션을 만들 수도 있고 영화 같은 영상을 만들 수도 있다”고 했다. 그러면서 “비디오는 이미지의 연속이기 때문에 이미지를 잘하는 기업이 비디오도 잘 만들 것이라고 생각한다”면서 “생성 AI만 연구개발해왔기 때문에 잘 할 자신이 있다”고 했다.

그는 “준비한 데이터를 클렌징해 학습시키고, 모델을 분석하고, 구조를 변경시키고, 파라미터를 조정하는 등 절차가 굉장히 길고 까다롭다”면서 “이 같은 과정을 빠르게 진행할 수 있는 시스템을 갖춰놨고 인프라가 준비되어 있기에 시장 변화에 빠르게 대응할 수 있다”고 했다. 스포키도 서비스를 개발하고 테스트하기까지 고작 2주가 걸렸다.

정 대표는 ‘초개인화 콘텐츠’를 만드는 것이 창업 초기부터 세운 목표라고 했다. 그는 “현재는 콘텐츠 하나를 만들면 다수가 보는, 대중을 위한 것이 만들어지고 있지만 앞으로는 나만을 위한 콘텐츠를 직접 만들 수도 있을 것”이라며 “글로벌 시장에서도 빛나는 AI 회사가 되도록 하겠다”고 말했다.

변지희 기자(zhee@chosunbiz.com)

<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.