컨텐츠로 건너뛰기
검색
ITWorld 언론사 이미지

“에이전트 중심 상호작용” 마이크로소프트가 그리는 코파일럿 다음 단계

ITWorld
원문보기

“에이전트 중심 상호작용” 마이크로소프트가 그리는 코파일럿 다음 단계

서울맑음 / -3.9 °

챗GPT, 코파일럿과 같은 생성형 AI에 이제 막 익숙해졌을지도 모르지만, 마이크로소프트는 사용자의 의지와 무관하게 다음 단계의 AI로 발걸음을 옮기고 있다. 업무 지시만으로 자율적으로 작업을 수행하는 AI 에이전트를 중심으로 하는 전환이다. 특히 기업 환경에서 변화가 두드러질 전망이다.


마이크로소프트는 19일(현지시간)부터 22일까지 진행하는 자사 연례 개발자 행사 ‘마이크로소프트 빌드(Build)’에서 자사 AI 비전을 구체화한 다양한 도구를 일반 사용자와 기업 고객에게 선보이기 시작했다. 대표적인 것이 ‘마이크로소프트 365 코파일럿 웨이브 2(Microsoft 365 Copilot Wave 2)’로 기존 마이크로소프트 365 애플리케이션을 확장해 채팅, 메모, AI 에이전트가 통합되는 중심 허브 역할을 한다. 여기에 코파일럿 서치(Copilot Search) 기능도 추가된다.


마이크로소프트는 기업 고객이 자사 데이터를 활용해 각 조직에 특화된 에이전트 및 AI 모델을 직접 학습시키기를 기대한다. 예를 들어, 법무 부서라면 해당 에이전트가 자동으로 합병 제안서나 면책 조항 문서를 신속하게 작성할 수 있도록 설정할 수 있다는 설명이다.


마이크로소프트는 아직 현실화되지 않은 미래를 대비해 AI 인프라를 선제적으로 구축하고 있다. 그중 하나가 ‘모델 컨텍스트 프로토콜(Model Context Protocol)’이다. AI 에이전트가 윈도우 네이티브 애플리케이션과 연동해 이를 제어할 수 있도록 지원하는 프레임워크로, 초기 버전의 코파일럿에서 약속했지만 아직 본격적으로 구현되지 않았던 기능이기도 하다.


또한 마이크로소프트는 개발자 대상으로 윈도우 AI 파운드리(Windows AI Foundry) 및 윈도우 AI 파운드리 로컬(Windows AI Foundry Local)을 선보였다. LLM이 로컬 환경에서 실행될 수 있도록 설계된 이 도구는 복잡한 코드 조정은 마이크로소프트가 처리하고, 사용자 PC에 이미 탑재된 하드웨어에 최적화된 방식으로 AI가 작동하도록 지원한다. 일반 사용자도 직접적인 혜택을 누릴 수 있는 기능이다.


마이크로소프트는 오픈AI, 메타, 앤트로픽 등 경쟁사에 뒤처졌더라도, 이를 만회하는 길은 결국 자사 업무 환경과 고객의 업무 전반에 AI를 깊이 통합하는 것에 있다고 판단한 듯하다. 최근 마이크로소프트가 일부 개발자를 AI로 대체하기 위한 정리해고를 단행한 것을 고려하면 불안하게 느껴질 수 있다.



마이크로소프트 AI 생태계의 변화


에이전트란 무엇일까? 코파일럿, 챗GPT, 클로드 등을 경험한 사용자라면 질문을 던졌을 때 AI가 이를 분석하고 필요한 정보를 모으는 일종의 ‘딥 리서치(Deep Research)’ 과정에 익숙할 것이다. AI는 사용자의 질문에 따라 계획을 세우고 필요한 내용을 스스로 찾아온다. 에이전트는 이보다 한층 자율적인 개념이다. 사용자가 작업을 지시하면 해당 작업이 끝날 때까지 스스로 처리하며, 필요 시 반복 수행도 가능하다. 물론 아직은 이론적 수준에 가까운 개념이다.


Microsoft

Microsoft


마이크로소프트 365 사용자는 마이크로소프트 365 코파일럿 웨이브 2가 업무에 즉각적인 영향을 미칠 것으로 보인다. 이 애플리케이션은 사람과 AI 에이전트 간 상호작용에 초점을 맞춰 설계됐다. 마이크로소프트는 마이크로소프트 365 메뉴에 ‘에이전트’ 항목이 추가된 화면을 시연했고, 여기에는 ‘리서처(Researcher)’와 ‘애널리스트(Analyst)’ 2가지 에이전트가 우선 제공된다. 이 기능은 AI 버전의 윈도우 참가자 프로그램인 ‘프런티어 프로그램(Frontier Program)’을 통해 순차 도입된다.


행사에서 마이크로소프트는 리서처와 애널리스트 기능을 설명하는 데모 영상 2편도 함께 공개했다. 리서처는 일종의 고도화된 ‘딥 리서치(Deep Research)’ 버전으로, 기존에는 AI가 계획을 수립한 뒤 사용자에게 확인을 요청했다면 리서처는 초기부터 사용자에게 아이디어를 던지고 질문을 주고받으며 작업을 전개한다.



애널리스트는 데이터 분석에 익숙하지 않은 일반 사용자, 혹은 실무 경험이 부족한 현업 사용자가 활용할 만한 기능이다.


애널리스트 데모 영상에서는 사용자가 코파일럿에 데이터를 회의용으로 정리해달라고 요청하는 기능이 소개된다. 즉, 복잡한 명령 없이 데이터를 의미 있는 형태로 자동 구성할 수 있다. 이와 유사하게 마이크로소프트는 파워BI(PowerBI)에서도 데이터에 대해 질문하는 ‘쿼리’ 기능을 개발 중이다. 이처럼 마이크로소프트트 유사한 생성형 AI 기능을 다양한 애플리케이션에 적절히 녹여내고 있다.



마이크로소프트는 이미 코파일럿 노트북(Copilot Notebooks)이라는 기능을 제공한다. 이 기능을 통해 사용자는 코파일럿에 질문을 던지고, 그 결과물을 인터랙티브 문서 형태로 변환할 수 있다. 회사에 따르면 이 작업은 모바일 환경에서도 가능하며, 완성된 문서는 워드와 같은 기존의 문서 포맷으로 저장할 수 있다.


또한 마이크로소프트는 오는 6월 중으로 코파일럿 서치와 코파일럿 메모리(Copilot Memory) 기능을 순차 도입할 계획이라고 밝혔다. 이미 일부 사용자에게 제공되고 있는 코파일럿 서치는 콘텐츠 크리에이터나 저널리스트의 추천 내용을 AI가 수집해 요약·정리한다. 결과에는 간결한 링크도 함께 표시돼 원문에 접근할 수 있다.


코파일럿 메모리는 단순한 검색 기록을 넘어서는 기능으로, 사용자가 문제를 어떻게 해결했는지를 기억하고 보여준다. 현재의 생성형 AI와의 상호작용은 대부분 일회성이고 대화가 끝나면 맥락도 사라지는 구조다. 마이크로소프트는 코파일럿이 수행한 작업과 그 과정 전체를 기억하고 저장하는 방식으로 전환하고자 한다.


마이크로소프트 CTO 케빈 스콧은 18일 인터뷰에서 “에이전트가 이전 대화를 기억할 수도 있다. 하지만 AI는 문제를 풀기 위해 거쳐간 중간 작업을 시간이 지났을 때 기억하지 못한다. 사람은 어떤 문제를 해결하면 그 과정을 종이에 적거나 디스크에 저장하거나 기억해두지만, AI는 그런 방식으로 작동하지 않는다. 그렇기 때문에 ‘메모리’는 우리가 반드시 해결해야 할 과제다. 단순한 기록이 아니라 생물학적 기억처럼 작동하는 ‘에이전틱 메모리(agentic memory)’로 구현돼야 한다”라고 설명했다.


마이크로소프트는 코파일럿의 ‘크리에이트(Create)’ 기능을 강화하기 위해 오픈AI의 최신 모델 GPT-4o를 통합할 예정이다. 오픈AI는 이 모델이 이미지 내 텍스트 생성에 특히 강점을 지닌다고 평가한다. 따라서 칠판에 문장을 쓰고 있는 너구리 그림을 요청한다면, 그 문장도 의미 있게 표현될 가능성이 높다.


또 다른 기능인 마이크로소프트 365 코파일럿 튜닝(Microsoft 365 Copilot Tuning)은 웨이브 2의 주요 방향성과 완전히 일치하지는 않지만, 마이크로소프트가 추진 중인 업무 자동화 전략의 연장선에 있다. 코파일럿이 사용자나 기업이 허용하는 범위 안에서 데이터를 학습해 반복적이고 단순한 업무를 대신 수행하는 데 초점을 맞추고 있다.


Microsoft

Microsoft


마이크로소프트는 “사용자는 CUA(Computer Using Agent) 기술을 활용해 데이터 전송, 문서 처리, 시장 조사, 규정 준수 모니터링 등 반복적인 작업을 자동화할 수 있게 될 것”이라고 밝혔다.


마지막으로 마이크로소프트는 엣지 브라우저 개선도 진행 중이다. 엣지는 웹상에서 공유된 워드, 엑셀, 파워포인트 파일을 더 잘 이해하고 처리할 수 있도록 업그레이드된다.



AI 에이전트 미래를 위한 밑그림


장기적으로 마이크로소프트는 AI 에이전트 기반 환경을 준비하고 있다. 과거 코파일럿을 통해 PC를 직접 제어하는 기능을 약속했지만 이는 아직 현실화되지 않았다. 현재로서는 설정 메뉴 일부를 제어하는 수준에 그친다. 하지만 마이크로소프트는 ‘모델 컨텍스트 프로토콜(Model Context Protocol, MCP)’이라는 기술을 통해 “윈도우를 에이전트 중심 미래(agentic future)에 맞춰 진화시키고 있다”라고 밝혔다. 이와 함께 윈도우 내부에 ‘앱 액션(App Actions)’ 기능도 도입할 계획이다.


마이크로소프트 윈도우 및 디바이스 부문 부사장 파반 다불루리는 블로그에서 “윈도우에 통합된 MCP는 AI 에이전트가 윈도우 네이티브 애플리케이션과 연결될 수 있는 표준화된 프레임워크를 제공한다. 이를 통해 애플리케이션은 에이전트 중심 상호작용에 자연스럽게 참여할 수 있다. 윈도우 애플리케이션은 특정 기능을 외부에 노출해 로컬에 설치된 에이전트의 역량과 기능을 보완한다”라고 설명했다.


앞서 언급한 윈도우 AI 파운드리의 구체적인 역할은 명확히 공개되지 않았지만, 올라마(Ollama)와 같은 모델 카탈로그와 AI 모델을 윈도우 환경으로 빠르게 불러와 개발자가 새로운 모델을 빠르게 실험할 수 있도록 지원하는 구조인 것으로 보인다. 해당 모델을 클라우드가 아닌 PC 로컬 환경에서 실행하는 ‘AI 파운드리 로컬(AI Foundry Local)’ 서비스도 함께 제공될 예정이다.


Microsoft

Microsoft


마이크로소프트는 “프리뷰 단계에서 파운드리 로컬은 윈도우 11 또는 맥OS 환경에서 AI 모델, 도구, 에이전트를 직접 디바이스에서 실행할 수 있도록 지원한다. 이는 윈도우 AI 파운드리(Windows AI Foundry)에 포함되며, 다양한 칩셋 환경에서도 뛰어난 성능을 발휘할 수 있도록 설계됐다. 수천만 대의 윈도우 디바이스에서 업계 최고 수준의 AI 기능을 제공할 수 있을 것”이라고 주장했다.


마이크로소프트에 따르면, 프리뷰 기간 동안 개발자는 윈겟(WinGet)을 통해 파운드리 로컬을 설치할 수 있고 전용 CLI(Command Line Interface)를 활용해 모델을 탐색·다운로드·테스트할 수 있다. 파운드리 로컬은 디바이스의 CPU, GPU, NPU 등 하드웨어를 자동으로 감지해 해당 환경에 적합한 모델 목록을 개발자에게 제시한다.


AI를 직접 다뤄본 경험이 있는 사용자라면 어떤 모델이 자신의 PC에서 작동하는지 확인하고, 해당 모델과 필요한 종속 항목을 설치하고, 이후 업데이트까지 진행하는 과정이 얼마나 번거로운지 잘 알고 있을 것이다. 파운드리 AI와 파운드리 로컬은 기본적으로 개발자 대상 도구지만, AI에 관심 있는 일반 사용자도 충분히 사용해볼 수 있는 도구가 될 수 있다.


dl-itworldkorea@foundryco.com



Mark Hachman editor@itworld.co.kr
저작권자 Foundry & ITWorld, 무단 전재 및 재배포 금지