클라우드플레어, 허깅페이스 AI 앱 배포 지원 확대

클릭 한 번으로 AI 앱 간편 배포
서버리스 방식으로 인프라 관리 부담 제거

클라우드플레어가 허깅페이스에서 클라우드플레어의 글로벌 네트워크에 간편하게 인공지능(AI) 애플리케이션을 배포할 수 있도록 지원한다고 밝혔다. 이의 일환으로, 클라우드플레어의 ‘워커스AI’는 허깅페이스 허브와 통합돼 서버리스 방식의 AI 애플리케이션 배포·활용을 지원한다.

매튜 프린스 클라우드플레어 CEO는 "최근 생성AI 붐으로 인해 다수의 기업들이 AI에 막대한 시간과 비용을 투자하고 있지만, 다수가 프로덕션에 적용에 어려움을 겪고 있다”며 “허깅페이스와 협력해 AI 기반 앱을 구축하는 데 드는 비용과 복잡성을 제거하고, 개발자가 직접 모델을 선택해 AI 앱을 글로벌로 즉시 확장할 수 있는 자유와 민첩성을 제공한다”고 말했다.

이번 발표로 개발자는 허깅페이스에서 한 번의 클릭으로 직접 AI 모델을 간편하게 배포할 수 있다. 오픈소스 모델 중 하나를 선택한 다음 ‘클라우드플레어 워커스AI로 배포’를 클릭하면 즉시 AI 모델을 배포할 수 있다.

총 14개의 허깅페이스 모델이 클라우드플레어의 서버리스 추론 플랫폼을 위해 최적화돼 제공되며, 이들은 각각 텍스트 생성·임베딩·문장 유사도 등 3개 작업 카테고리를 지원한다.

워커스AI는 효율적이고 경제적으로 AI 모델을 확장·배포하는데 필요한 엔드-투-엔드 인프라를 지원하는 대규모 서버리스 플랫폼으로, 미세 조정된 모델 가중치를 지원하도록 확장돼 보다 전문화된 도메인별 애플리케이션을 구축·배포할 수 있게 한다.

클라우드플레어는 서울을 포함해 케이프타운, 더반, 요하네스버그, 부에노스아이레스, 멕시코시티 등 전세계 150여개 도시에 GPU 인프라를 배치해 지연을 최소화한 추론을 지원한다.

클라우드플레어 AI 게이트웨이는 AI 애플리케이션을 위한 제어판도 제공해 개발자가 요청을 동적으로 평가하고, 다양한 모델과 공급자에게 라우팅할 수 있게 한다.

간편한 미세 조정도 장점이다. 워커스AI 플랫폼에서 데이터 기반의 미세 조정을 수행하고, 이를 워커스AI로 즉시 실행할 수 있다.

서버리스 방식으로 컴퓨터 용량에 대한 비용을 지불할 필요를 제거해 경제적으로 AI 배포가 가능하며 AI를 위한 GPU와 인프라에 대한 설정·관리·유지보수에 대한 부담도 줄일 수 있다는 게 사측 설명이다.

줄리앙 쇼몽 허깅페이스 CTO는 “클라우드플레어와 협력해 개발자가 AI에 더 쉽게 액세스할 수 있게 돼 기쁘다. 가장 인기 있는 개방형 모델을 서버리스 API로 제공하고, 전세계에 배포된 GPU로 구동하는 것은 허깅페이스 커뮤니티에도 획기적인 ”이라고 밝혔다.

상단영역

ITBizNews

본문영역