22일(현지시간) 앤스로픽은 자체 개발한 AI 모델 클로드 3.5 소넷의 업그레이드 버전을 공개하면서 이곳에 '컴퓨터 유즈'라는 기능을 추가했다. 컴퓨터 유즈는 PC 화면의 이미지·텍스트 등 정보를 이해하고 마우스 커서를 움직여 버튼을 클릭하며, 직접 텍스트를 입력해 정보 검색을 하는 등 사람이 컴퓨터를 사용하는 방식을 그대로 학습했다.
명령을 내리면 AI가 현재 화면을 스크린샷으로 찍어 인식한 후 이에 맞춰 마우스, 키보드 등을 움직여 사용자가 원하는 결과물을 만들어낸다.
예를 들어 친구와 함께하는 하이킹 코스에 샌프란시스코 금문교를 넣어 준비해 달라고 요청하면 AI가 스스로 구글에서 하이킹 코스를 찾고, 당일 날씨와 일출 시간을 확인한 뒤 어떤 옷을 입는 게 좋을지 등 세부 정보가 담긴 초대장을 친구에게 보내는 작업까지 완료하는 식이다.
앤스로픽은 "컴퓨터 유즈는 AI가 컴퓨터를 사용할 수 있는 첫 프런티어 AI 모델"이라며 "해당 기능은 내년 초 일반 소비자와 기업 고객을 대상으로 제공하기 시작할 것"이라고 밝혔다. 개발자들은 베타 버전을 먼저 사용해볼 수 있다.
새로운 기능을 공개하면서 앤스로픽은 여행 일정 작성 외에도 운영 업무 자동화와 코딩 등 세 가지 데모 영상을 공개했다. 코딩의 경우 사용자가 '크롬을 열어서 클로드 사이트에 들어간 뒤 클로드를 사용해 클로드 홈페이지를 1990년대 스타일로 만들라'고 명령하자 AI가 사용자의 컴퓨터에서 클로드를 실행시켜 여기에 프롬프트를 입력해서 사이트를 만들었다. 클로드 자체에 프롬프트를 입력하면 웹사이트를 코딩해주는 능력이 있기 때문이다.
프로그램이 사용자의 화면을 컨트롤하거나, 이를 자동화하는 서비스는 기존에도 존재했다. 하지만 이를 클로드와 같은 범용 AI 모델에 포함한 것은 앤스로픽의 '컴퓨터 유즈'가 처음이다. 앤스로픽은 AI가 사용자의 명령을 단계적으로 실행하도록 만들었다. 사용자는 클로드가 사용자의 컴퓨터에서 하는 행동을 단계적으로 모니터링할 수 있다.
클로드가 AI 모델의 에이전트 기능을 강화하면서 빅테크 기업들의 AI 에이전트 경쟁은 더욱 치열해질 것으로 예상된다.
최근 마이크로소프트가 AI가 여러 가지 업무를 대신해주는 '자율 에이전트'를 공개한 데 이어 세일즈포스는 지난달 '드림포스2024'에서 '에이전트포스'를 공개했다. 서비스나우, 워크데이 등도 AI 에이전트를 서비스하고 있다. 오픈AI 역시 AI 에이전트를 개발 중인 것으로 알려져 있다.
[실리콘밸리 이덕주 특파원]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.