컨텐츠로 건너뛰기
검색
파이낸셜뉴스 언론사 이미지

"맞춤번역기 고도화… 다른 언어 써도 대화 통하는 시대올것" [AI 혁신가를 만나다]

파이낸셜뉴스 조윤주
원문보기

"맞춤번역기 고도화… 다른 언어 써도 대화 통하는 시대올것" [AI 혁신가를 만나다]

서울맑음 / -3.9 °
이정수 플리토 대표
10여년 언어데이터 꾸준히 축적
실시간 통역서비스 LT 해외 진출
개인용 통역기 CT도 경쟁력 입증
발화습관·음성까지 익혀 차별화
창업 초반부터 글로벌시장 겨냥
아시아 넘어 중동까지 모델 확장
韓 AI산업 최대과제로 투자 꼽아
"美기업은 데이터에 조단위 쏟아"


플리토 이정수 대표

플리토 이정수 대표


"사람도 학습을 많이 하면 똑똑해지듯, 인공지능(AI) 역시 결국 학습 데이터가 중요하다." 플리토 이정수 대표는 12일 파이낸셜뉴스와의 인터뷰에서 "AI를 사람의 뇌로 비유하면, 반도체는 뇌의 외형이고 알고리즘이나 GPT 같은 모델은 뉴런의 움직임이다. 데이터는 학습에 해당하죠"라며 이같이 말했다.

지난 2012년부터 언어 데이터를 축적·정제하고 학습시켜왔던 플리토는 최근 AI 통역 서비스 라이브 트랜스레이션(LT·Live Translation), 챗 트랜스레이션(CT·Chat Translation)을 잇따라 출시하며 시장 경쟁력을 키우고 있다.

LT는 실시간 통역 서비스다. 글로벌 빅테크들도 번역 서비스를 제공하지만, 정작 컨퍼런스 현장에서는 거의 사용되지 않는다는 점에 주목했다. 2024년 출시한 LT는 초기 내부 만족도가 약 80% 수준이었지만, 당시 대부분의 컨퍼런스가 통역을 아예 사용하지 않던 시기였던 점이 오히려 기회가 됐다. 이 대표는 '외국인이 한 명이라도 오면 도움이 되지 않겠느냐'며 무료 제공을 제안했고, 이는 실제 사용해 본 이들의 호응으로 이어졌다. 현재 플리토의 LT는 하루 평균 9개 이상의 컨퍼런스에서 활용되고 있으며, 한국을 넘어 일본·베트남 등 해외로도 사용 범위를 넓히고 있다.

LT 확산은 개인용 통역 서비스 CT로 이어졌다. CT의 핵심 차별점은 개인화가 가능하다는 점이다. 사용자의 발화 습관, 음성 톤, 표현 방식, 고유명사까지 학습해 범용 번역기가 아닌 '나만의 번역기'로 작동하는 구조다. 이 대표는 "고유명사를 틀리면 신뢰가 무너진다"며 "플리토는 컨퍼런스 발표 자료와 전문 용어를 사전에 학습시킨다"고 설명했다. CT는 QR 코드를 스캔하면 각자의 휴대폰에서 CT가 실행되고, 각자의 개인화 엔진이 연결돼 대화가 이뤄진다. 화자 분리도 자동으로 작동한다. 이 과정에서 수집되는 데이터는 다시 엔진 성능을 높이는 자산이 된다. 번역 과정에서 기계가 완전히 인식하지 못한 표현은 별도로 수집돼 다양한 발음 데이터로 확장된다. 한 단어당 수십 개, 많게는 100개 이상의 발음 데이터가 쌓이고, 검증을 거쳐 정확도가 높은 데이터만 남는다. 이 대표는 "엔진 성능이 높아지면 매출도 함께 성장하는 구조"라고 말했다.

플리토는 AI 학습용 언어 데이터 글로벌 매출이 지속 증가하며, 지난해 3분기까지 누적매출 258억원으로 어닝 서프라이즈를 기록했다. 이 추세라면 지난해 한 해 매출 500억원 안팎에 이를 것으로 보인다. 플리토는 5개 분기 연속 영업이익 흑자도 기록 중이다.

이 대표는 특히 "AI에서 데이터 학습은 절대적으로 중요하다"고 강조했다. AI 시대가 본격화됐지만, 데이터의 역할과 중요성에 대한 이해는 여전히 부족하다는 게 이 대표의 진단이다. 그는 "한국이 데이터에 쓰는 비용은 미국의 약 100분의 1 수준"이라며 "공부로 비유하면 미국 학생이 일주일에 100시간을 공부할 때 한국은 1시간 공부하는 셈"이라고 토로했다. 뇌 구조와 알고리즘이 같다고 가정하더라도, 이 상태로는 글로벌 선두 그룹을 따라잡기 어렵다는 설명이다.


데이터 기업인 플리토가 이런 어려운 환경에서 생존할 수 있었던 것은 국내 바운더리를 넘어, 창업 초반부터 글로벌 시장을 목표로 했기 때문이다. 미국 대기업들을 대상으로 다양한 언어의 데이터를 만들어 판매했고, 이 전략은 성과로 이어졌다. 현재 플리토 매출의 약 90%는 미국에서 발생하고 있다. 데이터를 장기간 다뤄온 경험은 자연스럽게 솔루션 개발로 이어졌다. 이 대표는 "데이터를 계속 다루다 보니, 우리가 직접 AI 서비스를 만들어도 제대로 할 수 있겠다는 판단이 들었다"며 "그 결과가 LT와 CT"라고 설명했다.

시장에서는 2027년을 전후로 AI가 학습할 수 있는 디지털 데이터가 고갈될 것이라는 전망이 나온다. 이 대표는 "AI가 스스로 만든 데이터를 다시 학습하는 구조에서는 모델 붕괴 현상이 발생한다"며 "앞으로는 사람이 자연스럽게 만든 데이터의 가치가 더 커질 수 밖에 없다"고 말했다.

플리토의 사업은 한국에만 국한되지 않는다. 일본, 베트남, 미국, 중동까지 동일한 모델로 확장 중이다. 중학교 2학년까지 사우디아라비아에서 생활했던 이 대표에게 중동 시장도 핵심 공략지다. 플리토는 사우디·이집트·모로코·알제리 등 지역별 아랍어 방언 데이터를 집중적으로 축적해왔다.


그는 한국 AI 산업의 과제로 데이터 투자 확대를 꼽았다. 그는 "미국 기업들은 데이터에만 조 단위로 투자하지만, 한국은 가장 많이 써도 100억 원이 안 된다"며 "이 차이가 곧 국가 간 AI 경쟁력의 차이"라고 지적했다.

플리토의 향후 로드맵은 CT와 LT를 중심으로 한 데이터 확장이다. 음성 데이터를 중심으로 수집을 강화하고, CoT(Chain of Thought) 등 대형 언어 모델의 정확도를 높이는 고급 학습용 데이터도 늘릴 계획이다.

이 대표는 "올 하반기쯤 제가 일본 이자카야에 가서 CT QR 코드를 보여주면, 사장님이 QR 코드를 찍고 서로 각자의 언어로 자연스럽게 대화하는 장면을 보는 것, 그게 제일 큰 꿈"이라며 "그 순간이 오면 플리토가 만든 기술이 전 세계 사람들의 일상 속으로 들어갔다고 느낄 것 같다"고 했다.


yjjoe@fnnews.com 조윤주 기자

Copyrightⓒ 파이낸셜뉴스. 무단전재 및 재배포 금지.