일반 사용자도 워커스 AI 이용 가능
<이미지를 클릭하시면 크게 보실 수 있습니다> |
커넥티비티 클라우드 기업인 클라우드플레어(Cloudflare)는 허깅페이스에서 클릭 한 번으로 클라우드플레어의 글로벌 네트워크에 인공지능(AI) 애플리케이션을 배포할 수 있도록 지원한다고 4일 밝혔다.
클라우드플레어는 자사 ‘워커스 AI’(Workers AI)를 일반 사용자도 이용할 수 있게 됨에(General Availability, GA) 따라, 허깅페이스 허브와 통합돼 모델 배포를 지원하는 최초의 서버리스 추론 파트너가 된다.
이로써 개발자가 인프라를 관리하거나 사용하지 않는 컴퓨터 용량에 대한 비용을 지불할 필요없이 전 세계를 대상으로 빠르고, 쉽고, 경제적으로 AI를 배포할 수 있도록 지원한다는 방침이다.
매튜 프린스(Matthew Prince) 클라우드플레어 CEO 겸 공동 창업자는 “최근 생성형 AI 붐으로 인해 다수의 기업들이 AI에 막대한 시간과 비용을 투자하고 있다. 그 중 일부는 효과가 있겠지만, 데모는 쉬워도 이를 프로덕션에 적용하는 것은 매우 어렵다는 것이 현재 우리가 직면한 도전과제”라고 지적했다.
이어 그는 “클라우드플레어는 AI 기반 앱을 구축하는 데 드는 비용과 복잡성을 없앰으로써 이러한 문제를 해결하고자 한다”면서 “워커스 AI는 추론을 실행할 수 있는 가장 접근하기 쉬운 솔루션으로, 간단하고 경제적인 방식으로 AI를 대중화하려는 클라우드플레어와 허깅페이스의 노력을 바탕으로 우리는 개발자가 직접 모델을 선택하고 AI 앱을 글로벌로 즉시 확장할 수 있는 자유와 민첩성을 제공한다”고 강조했다.
이제 워커스 AI는 일반 사용자도 이용할 수 있으며, 클라우드플레어는 워커스 AI로 사용자들이 차세대 AI 애플리케이션을 위해 효율적이고 경제적으로 AI모델을 확장하고 배포하는데 필요한 엔드 투 엔드 인프라를 제공할 계획이다.
클라우드플레어는 최근 서울, 케이프타운, 더반, 요하네스버그, 부에노스아이레스, 멕시코시티, 뭄바이 등을 포함한 전 세계 150여개 도시에 GPU를 보유하고 지연을 최소화한 추론을 지원한다. 또한 워커스AI는 미세 조정된 모델 가중치를 지원하도록 확장되어 조직이 보다 전문화된 도메인별 애플리케이션을 구축하고 배포할 수 있도록 지원한다.
이밖에도 클라우드플레어의 AI 게이트웨이(AI Gateway)는 AI 애플리케이션을 위한 제어판(control plane)을 제공하여 개발자가 요청을 동적으로 평가하고 다양한 모델과 공급자에게 라우팅할 수 있도록 하며, 나아가 개발자가 데이터를 사용하여 미세 조정하고 워커스 AI 플랫폼에서 미세 조정한 결과물을 바로 실행할 수 있게 지원한다.
특히 일반 사용자도 클라우드플레어의 워커스 AI를 이용할 수 있게 됨에 따라, 이제 개발자는 허깅페이스에서 한 번의 클릭으로 직접 AI 모델을 배포할 수 있다.
개발자는 인기 있는 오픈 소스 모델 중 하나를 선택한 다음 ‘클라우드플레어 워커스AI로 배포’를 클릭하기만 하면 즉시 모델을 배포할 수 있다. 총 14가지의 허깅페이스모델이 클라우드플레어의 전역 서버리스 추론 플랫폼을 위해 최적화되어 있으며, 텍스트 생성, 임베딩, 문장 유사도 등 3가지의 각기 다른 작업 카테고리를 지원한다.
줄리앙 쇼몽(Julien Chaumond) 허깅페이스 공동창업자 및 CTO는 “클라우드플레어와 협력해 개발자가 AI에 더 쉽게 액세스할 수 있게 되어 기쁘다”면서 “가장 인기 있는 개방형 모델을 서버리스 API로 제공하고, 전 세계에 배포된 GPU로 구동하는 것은 허깅페이스 커뮤니티에도 획기적인 제안이며, 이를 통해 앞으로 무엇을 만들어 나갈지 기대된다”고 전했다.
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.