요리할 때 식기세척기 쓰듯 … AI에이전트가 잡일 도맡아 처리

매일경제 원문
이덕주 특파원(mrdjlee@mk.co.kr)
입력

2024.11.11 16:20

주소복사가 완료되었습니다

<이미지를 클릭하시면 크게 보실 수 있습니다>

인공지능이 사람을 대신해 각종 업무를 대신해주는 '인공지능(AI) 에이전트'가 최근 화두다. 특히 기업 내부의 업무를 AI가 대신해 생산성을 높여주는 엔터프라이즈 분야의 AI 에이전트는 거대한 시장을 만들어낼 것으로 기대되고 있다.

이 분야에 가장 앞선 회사는 엔터프라이즈 소프트웨어 분야 최강자인 미국 세일즈포스다. 세일즈포스는 스탠퍼드대에서 로보틱스와 딥러닝 결합을 연구했던 실비오 사바레세 교수를 2021년 '최고과학자(Chief Scientist)'로 영입해 세일즈포스 AI 연구소를 설립했다. AI 에이전트 분야의 최고 전문가라고 할 수 있는 그에게서 AI 에이전트의 미래를 들어봤다. 한국 언론사와는 첫 인터뷰다. 다음은 일문일답.

― 세일즈포스에 합류하기 전 스탠퍼드대에서 무엇을 연구했나.

▷커리어의 대부분을 대학에서 보냈다. 내 목표는 로봇이 환경을 이해하고, 사물을 인식하고 이에 따라 조정할 수 있도록 연구하는 것이었다. 이 당시에 나는 물리적 에이전트가 물리적 세계와 상호 작용하는 것을 연구했다. 당시에는 이를 위한 충분한 데이터가 없었다. 로봇을 학습시키기 위해 데이터가 필요했고, 그래서 셰이프넷(ShapeNet)을 만들었다. 여러 대학의 교수들과 많은 양의 3D 모델을 수집해 AI 모델을 인공신경망을 통해 학습시켰다.

― 챗GPT가 뜨기 전인 2021년 4월 세일즈포스에 수석과학자로 합류했다.

▷로보틱스 외의 영역에서 연구한 것을 넘어 기반이 되는(foundational) AI 모델을 연구하고 싶었다. 큰 조직에 합류해 내가 연구한 것으로 실제 세계와 엔터프라이즈 고객에 긍정적인 영향을 주고 싶다는 생각을 했다.

― 세일즈포스 AI 연구소는 무엇을 하나. 연구소의 결과물이 있다면.

▷우리의 목표는 세일즈포스 제품에 혁신을 가져오는 것이다. 세 가지 영역이 있다. 하나는 기초연구이고 두 번째는 제품 혁신, 세 번째는 인큐베이션이다. 첫 번째 기초연구로 특허를 얻거나 오픈소스로 발표를 한다. 챗GPT 등장 이전에 많이 알려진 연구 결과로 트랜스포머 모델에서 프롬프트 엔지니어링을 연구한 것이 있다. 우리 연구소는 소프트웨어 생성을 위한 최초의 대규모언어모델(LLM)을 만들기도 했다.

두 번째는 제품 혁신이다. 우리는 이런 연구가 세일즈포스 제품을 혁신하도록 돕는다. 사업총괄(General Manager)과 프로덕트매니저(PM)들과 협업하는 것이다. 세 번째는 고객 인큐베이션이다. 우리는 고객들과 전략적 협력을 통해 고객들이 경험하는 심각한 문제를 해결하도록 돕는다. 제품 혁신은 PM들과 함께 일하지만, 인큐베이션은 고객과 직접 협력한다. 보통 우리는 이런 협력을 통해 프로토타입이나 개념입증(PoC) 정도가 결과물로 나온다.

― 세일즈포스 AI 리서치가 만든 엑스젠세일즈(xGen-Sales)는 무엇이고, 이런 도메인에 특화된 LLM이 왜 필요한가.

▷일반 소비자 영역에서는 GPT, 클로드, 라마 같은 큰 규모의 프런티어 모델이 효율적이다. 반면 엔터프라이즈 영역은 문제와 유스케이스가 구체적으로 잘 정의돼 있다. 범용 기능이 필요 없기 때문에 작은 모델이 더 좋은 해결책이다.

작은 모델은 학습해야 할 매개변수가 적다. 엑스젠은 이런 유스케이스에 적합한 30억~70억개의 매개변수를 가지고 있다. 영업용 글을 작성하거나 이메일을 쓰기도 하고, 대화 요소를 서비스 클라우드 유스케이스에 집어넣는 것이 가능하다. 모델이 작아서 학습이 쉽고 빠르며 추론 비용도 적게 든다. 마지막으로 환경에 미치는 영향도 작다. 소비전력이 낮기 때문에 탄소배출이 훨씬 적기 때문이다.

― AI 에이전트에서 유저 인터페이스의 중요성이 강조되고 있다.

▷이 문제는 클라라 시 세일즈포스 AI 최고경영자와 광범위하게 협력하고 있다. 우리는 생성형 캔버스, 생성형 UX라는 것을 만들고 있다. 세일즈포스 플랫폼에서 사용이 가능하다. 이용자의 과업을 이해하고, AI를 워크플로에 포함시키는 것을 통해 고객의 훌륭한 AI 경험이 달성된다고 생각한다. 생성형 AI는 자연어 대화를 부드럽고 효과적으로 만들 수 있고, 여러 단계가 필요한 일을 짧은 대화로 달성할 수 있게 한다. 이는 생성형 AI, 대화형 AI의 가장 큰 힘이다.

― AI가 고객의 컴퓨터 화면을 직접 조종하는 앤스로픽의 '컴퓨터 유즈'를 어떻게 생각하나.

▷혁신의 일부라고 생각한다. 이를 통해 인간이 창조적인 업무를 할 수 있다. 스크린 에이전트를 통해 신입 직원이 생산성을 높일 수 있도록 교육하는 코치 역할을 AI가 할 수 있다. 직원은 대신 경험에 집중할 수 있다. 이는 AI 툴의 사용을 민주화할 것이다.

경험이 많은 직원들도 이런 툴이 생산성을 높일 것이다. 우리가 요리를 할 때 전자레인지나 식기세척기를 사용하는 것처럼, AI를 쓰게 되고 인간은 좀 더 높은 차원의 일을 하게 된다. 가족과 보내는 시간도 늘어날 것이다. 미래에 근로자는 계획자가 될 것이다. 다양한 AI 에이전트가 낮은 차원의 업무를 하도록 하고 자신은 디자인과 창조적인 일을 하는 사람이 될 것이다.

― 거대행동모델(LAM·Large Action Model)을 얘기했는데.

▷내가 LAM이라는 개념을 얘기한 것은 우리가 LLM 너머를 가야 하기 때문이다. LLM은 생성을 한다. 텍스트를 생성하고 요약을 하고, 이메일을 쓰거나 정보를 찾는 등의 일이다. 멀티모달리티를 통해 그림을 그리기도 한다. 하지만 LLM은 실제 세계에서의 행동은 하지 않는다.

사실 LAM은 우리 세일즈포스가 가지고 있던 상표이고, 내가 세일즈포스에 합류한 뒤 작년에 다시 가져온 것이다. 우리는 모델을 실제 세계에서 학습시켜 언어뿐만 아니라 행동까지 할 수 있도록 학습시켜야 한다. 실제 세계의 반응에 따라 AI 모델의 행동을 변화시키고, 이 행동이 환경에 어떤 영향을 미치는지도 학습시킨다. LAM의 학습 과정은 강화학습 과정과 유사하다.

― 최근의 인공신경망 연구에 대한 생각은.

▷이 업계에서 기술이 얼마나 빠르게 발전하는지를 보는 것은 신기한 경험이다. 이제 다음 세대의 문제를 해결하는 것이 중요하다고 생각한다. 첫 번째 영역은 에이전트-에이전트 상호 작용을 어떻게 만들지 해결하는 것이다.

두 번째 영역은 멀티모달 에이전트다. 에이전트가 주변을 인식하고 행동할 것인가를 뜻한다. 이런 에이전트가 물리적 세계에서 로봇으로 어떻게 행동할 것인가에 대한 연구가 중요하다고 본다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

AI 이슈 트렌드

01.03 (금)

요리할 때 식기세척기 쓰듯 … AI에이전트가 잡일 도맡아 처리

매일경제 주요 뉴스