컨텐츠 바로가기

04.20 (토)

[인터뷰] 장두성 KT AI2XL연구소 라지 AI 코어 담당 상무 "GPT3는 생성에 특화돼 있지만 KT 개발 초거대 AI는 이해와 생성 양쪽에 강점 있어"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
메트로신문사

<이미지를 클릭하시면 크게 보실 수 있습니다>


"GPT-3와 KT의 라지 AI는 트랜스포머 기반 기술로 개발했다는 점에서는 동일합니다. 하지만 GPT3는 문장 생성에 특화된 기술로 디코더 기술 만을 사용했습니다. 반면, KT가 개발한 라지 AI는 GPT-3와는 달리 인코더와 디코더를 같이 학습해 이해와 생성 앙쪽에 강점이 있습니다."

5일 서울 서초구 KT연구개발센터에서 만난 KT융합기술원 AI2XL연구소에서 초거대 AI를 책임지는 장두성 KT Large AI Core상무는 KT가 개발한 초거대 AI 기술이 갖는 장점에 대해 이 같이 설명했다.

장 상무는 "GPT-3가 1750억개의 매개변수를 활용한 것과 비교해, 우리가 개발한 라지 AI는 개발이 완료되면 2000억개의 매개변수의 크기에 도달하는 것을 목표로 학습을 진행하고 있다"며 "아직 학습이 끝나지 않은 상태인데 학습은 내년 초 마무리될 것"이라고 밝혔다.

KT는 2년 전 AI 원팀을 공식화하기 이전, ETRI, 카이스트, 한양대학교와 공동으로 초거대 AI를 개발하기 위해 무엇을 준비해야 할 지 의견을 내 자문을 받고 진행해왔는데, 이번에 선보인 초거대 AI '믿음'은 KT가 ETRI, 한양대, 카이스트와 컴포넌트를 나눠 개발한 것이다.

장 상무는 "KT가 라지 AI를 주관해 설계했는데, AI의 구조 설계와 학습 인프라 구축을 주도해 진행했으며, 학습, 경량화 기술, 특정 부분에 대해 효율적으로 학습하는 기술 을 주도적으로 개발했다"며 "거대 AI의 기술들은 이미 일부가 서비스에 적용됐지만 아직도 상당수 기술은 적용되기를 기다리는 상황"이라고 설명했다.

KT의 초거대 AI는 네이버, LG AI연구원, SKT, 카카오 등 경쟁업체와 내놓은 초거대 AI와 어떤 점이 차별화될까. 그는 "KT는 처음 거대 AI를 개발할 때부터 사업에 빨리 적용되는 기술을 개발하는 것을 목표로 삼았다. '협업 융합 기술'이라고 이름 지었다. AI 기술을 특정 사이트에 적용하려면 AI 학습에 들어가는 시간이 많이 걸리고, 인프라도 많이 필요한 데 굉장히 빠르게 특정 영역에 적용할 수 있도록 라지 AI를 줄이는 경량화 기법을 사용했다. GPT-3는 문장을 자연스럽게 생성하는 데 중점을 뒀다면, 우리는 문장을 해석하고 이해와 생성에 같이 쓸 수 있는 기능에 포커스해 개발했다"고 설명했다.

메트로신문사

<이미지를 클릭하시면 크게 보실 수 있습니다>


장 상무는 "라지 AI가 현재 AICC(AI컨택센터)에 적용되고 있는데, 음성인식, 화자인식을 해 누가 얘기하고 어떤 얘기를 하는 지 판단해준다. 보이스봇이 전체의 40%의 질문이 직접 대답해주고 있으며 60% 정도는 휴먼 상담사가 얘기한다. 라지 AI가 상담사에 들어오는 문장을 자동 분류해 어떤 얘기를 하고 있다고 '상담메모'를 적어준다. 2년 전에도 이 같은 요약 기능을 제공했지만, 기능이 부실해 불만이 많았는데 라지 AI를 적용했더니 상담사들의 만족도가 높아졌다. 화자인식을 할 때 15초 정도 시간이 줄고 요약을 하면서 15초가 감소한다. 올해 말 AICC 100석에 적용할 계획인데, 상담사가 좋은 상품을 추천하는 역할을 도와준다"고 말했다.

그는 "AICC는 클라우드향으로 전환해 사업을 할 예정이며, 소비자 상담에서 상담을 분류하는 '에이센 클라우드' 서비스에도 라지 AI를 적용할 예정이다. 에이센 클라우드 개발은 거의 끝났고 출시 시점을 타진하고 있다"고 밝혔다.

장 상무는 또 "지난 10월부터 기가지니 앞에서 어린이가 얘기하면 어린이 목소리로 얘기해주는 '키즈 스타일링' 서비스를 제공하고 있다. 내년에는 사투리나 키즈 목소리로 바꿔주는 기능을 적용할 계획"이라고 말했다. 또한 "오은영 박사의 육아 상담 코너는 특정한 도메인에서 그 사람의 지식을 가지고 그 사람 목소리로 얘기하는 기술을 만들었다. 육아 상담 뿐 아니라 다양한 전문가 시스템에서 사용할 예정이다. 또 시니어 케어 서비스는 내년에 출시하기 위해 논의 중"이라고 말했다.

그는 또 초거대 AI가 많이 쓰이는 분야로 패러프레이징(Paraphrasing)을 꼽았다. 장 상무는 "특정 서비스를 제공하기 위해 학습 데이터를 증강시키는 기술을 활용하고 있는데, 본인들이 만든 서비스를 부풀리는 페러프레이징 작업을 하고 있다. 또 의도 분류 작업에도 활용하고 있다"고 설명했다.

하지만 이 같이 많은 장점을 가진 라지 AI에 단점도 존재한다.

그는 "라지 AI가 편향성 문제를 갖는데, 특정 계층에 대해 안 좋은 생각을 가지고 있다. 이는 사람들이 만든 데이터여서 사람들의 편향성이 데이터에 반영된 것으로 편향성을 줄이기 위해 데이터를 균등하게 모으고 있다. 여러 인종이 쓰는 데이터를 모집하고 특정한 계층의 데이터 만을 사용하는 것을 배제하고 있다. 또 데이터에 욕설이나 비윤리적인 표현이 들어있으면 이런 것을 필터링한다. 라지 AI가 거짓말을 잘 하는데, 팩트 체크 기술로 정확한 지식원인지 분명한 문장인지 판단해 이를 극복하고 있다"고 밝혔다.

메트로신문사

<이미지를 클릭하시면 크게 보실 수 있습니다>


라지 AI를 국내에만 한정하지 않고 타국어 기반으로 개발해 수출할 생각은 없는 걸까. 장 상무는 거대 AI는 한국어에 포커스가 돼 있는데, 동일한 기술을 바이링구얼로 적용하는 것을 고려하고 있다"며 "한국어와 영어 등 2개를 생각하고 있으며, 2000억개의 매개변수가 나올 때 같이 출시될 예정"이라고 밝혔다.

KT는 라지 AI를 어떻게 관련업계로 확산시켜 나갈 지도 궁금했다.

그는 "지니랩스에서 라지 AI를 바탕으로 다양한 서비스를 만들 수 있도록 하고 있다. 22개 정도의 서비스가 있는데, 13개 정도는 국가 국책연구기관인 나이파에서 수행하는 초거대 API 사업에 적용하고 있다. 우리도 13개의 API를 제공하고 있다. 우리가 거대 AI로 직접 기술을 개발하기도 하지만 능력있는 회사들이 저희 기술을 이용해 새로운 기술을 개발하거나, 우리 기술과 그들의 기술을 엮어 새로운 기술도 만들고 있다. 나이파 사업 통해 53개 기업들이 우리의 거대 AI를 사용하고 있다"고 설명했다. 장 상무는 "정부는 나이파 바우처 사업을 통해 기업이 API 사용하는 비용을 내면 국가에서 일정 부분을 지원하는 사업을 전개하고 있다. 지니랩스를 통해 새로운 기술을 제안하면 KT가 그들과 함께 공동으로 서비스를 개발하고 일정 부분 수익을 가져갈 수 있다"고 설명했다.

장 상무는 "기존의 AI 기술은 새로운 서비스를 만들기 위해 데이터가 굉장히 많이 필요했는데, 라지 AI 기반에서는 효율적 학습 기법을 도입해 기존 대비 1/3 데이터만으로도 서비스를 만들 수 있다. 사용자 관점에서도 이전에는 한턴이나 두 턴 정도 해석을 했다면, 라지 AI를 사용하면 어제 얘기한 것까지 다 기억하고 해석해주기 때문에 편리하다"고 말했다.

KT는 초거대 AI인 '믿음'에 대해 '인간과 공감하는 AI를 만드는 것을 추구하고 있다.

장 상무는 "거대 AI는 실제 사용자와 주고받는 인터랙션을 기억하고 말과 문맥을 이어간다. 거대 AI는 사용자에게 내가 당신을 잘 이해하고 있다는 공감대를 형성하는 역할을 하게 된다"고 설명했다.

그는 또한 "AI 중심의 디지코를 개발할 때 빠르게 학습하고 경량화하는 방법으로 개발했다. 저렴한 하드웨어에서 빠르게 학습할 수 있는 AP 칩을 만들기 위해 노력했다. 그 위에 라지 AI 추론을 할 때 학습할 플랫폼 기술이 필요해 하드웨어, 소프트웨어, 미들웨어 플랫폼까지 동시에 개발을 했다. 파라미터 학습 기법을 거대 AI에 적용했으며 인프라를 적게 사용하는 경량화 기술을 사용했다. 개발비용은 기존 AI보다 라지 AI 비용이 더 드는데, 기존의 1~2배 비용에서 할 수 있도록 인프라, 클라우드 사업 등에 적용하는 방안을 추진 중"이라고 밝혔다.

또한 빠르면 올해에서 내년 초 미국 오픈 AI가 'GPT-4'를 내놓을 계획인 데 초거대 AI 출시가 너무 늦은 것은 아닐까. 그는 "'믿음'은 데이터를 잘 만들고 신경망 크기보다는 효율적으로 학습하는 것에 초점을 맞추고 있다. GPT-4에 앞설 수는 없지만 한국어에 있어서는 더 빠르게 접근하고 있다. 최근 거대 AI의 연구는 신경망의 크기를 키우는 경쟁에서 벗어나 내실을 키우는 경쟁으로 진화하고 있다"고 설명했다. 또 '멀티모달 AI'는 아직 공개를 못 하고 있는데, KT는 거대 AI를 음성, 영상, 언어를 통합한 멀티모달 AI로 진화시키는 데 활용하려 하고 있다.

장 상무는 앞으로 초거대 AI의 목표에 대해 "KT의 AI 사업에 적용해 우선적으로 기능을 혁신하는 게 목표"라며 "AICC, 기가지니, 지능형 로봇 등에 적용하고 있다. 또 거대 AI를 이용해 B2B 등 그동안 제공하지 못 했던 분야에 지속적으로 활용해나갈 계획"이라고 밝혔다.


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.