데이터 플라이휠 최적화로 생산성 개선, 맞춤형 AI에이전트 구축 지원

미국 캘리포니아주 산타클라라 소재 엔비디아 본사 [사진=AFP통신]
미국 캘리포니아주 산타클라라 소재 엔비디아 본사 [사진=AFP통신]

엔비디아가 에이전트 기반 인공지능(AI) 플랫폼 개발을 가속화하고 기업 생산성을 높이는 ‘엔비디아 네모 마이크로서비스’를 정식 출시했다고 밝혔다.

네모 마이크로서비스는 기업 IT부서가 데이터 플라이휠을 활용해 직원 생산성을 높일 수 있는 AI 팀원을 빠르게 구축할 수 있도록 지원하는 개발자 환경이다.

데이터 플라이휠을 통해 기업 IT부서는 AI 에이전트를 디지털 팀원으로 온보딩할 수 있는데, 이같은 에이전트는 사용자 상호작용과 AI 추론 과정에서 생성된 데이터를 활용해 모델 성능을 지속적으로 개선할 수 있어 ‘사용’을 ‘인사이트’로, ‘인사이트’를 ‘실행’으로 전환할 수 있다고 엔비디아는 설명했다.

데이터베이스, 사용자 상호작용 등 고품질 입력이 지속적으로 제공되지 않으면 에이전트의 이해력은 약화되며 응답 신뢰성이 떨어지고, 에이전트의 생산성 또한 저하될 수 있다.

즉 운영 환경에서 AI에이전트를 효과적으로 유지·개선하기 위해서는 ▲추론 데이터 ▲최신 비즈니스 데이터 ▲사용자 피드백 데이터 등 3개 유형의 데이터가 필요하며 이들 데이터를 효율적으로 활용할 수 있도록 지원하는 것이 네모 마이크로서비스라는 것이다.

엔비디아는 "네모 마이크로서비스는 최첨단 에이전틱 AI시스템의 개발을 가능하게 하고 추론 결과, 비즈니스 데이터, 사용자 선호도에 기반한 데이터 플라이휠을 통해 지속적인 최적화를 이뤄내는 엔드 투 엔드 개발자 플랫폼을 제공한다"며 "에이전트를 구동하는 모델을 선별하고 맞춤화하며, 평가하고 안전장치를 적용하는 데 필요한 엔드 투 엔드 환경"이라고 설명했다.

엔비디아가 ‘엔비디아 네모 마이크로서비스’를 정식 출시했다. [사진=엔비디아]
엔비디아가 ‘엔비디아 네모 마이크로서비스’를 정식 출시했다. [사진=엔비디아]

이 서비스는 네모 커스터마이저, 네모 이밸류에이터, 네모 가드레일을 포함하며 네모 리트리버, 네모 큐레이터와 함께 사용돼 맞춤형 엔터프라이즈 데이터 플라이휠을 통해 AI에이전트를 구축·최적화·확장하는 과정을 돕는다.

엔비디아에 따르면, 네모 커스터마이저는 대규모언어모델(LLM) 미세 조정을 가속화해 최대 1.8배 높은 훈련 처리량을 제공하며 네모 이밸류에이터는 개인과 산업 벤치마크에서 AI 모델과 워크플로우의 평가를 5번의 API 호출로 간소화한다. 네모 가드레일은 단 0.5초의 추가 지연 시간만으로 규정 준수 보호 기능을 최대 1.4배까지 향상시킨다.

현재 블랙록, 시스코, AT&T 등이 네모 마이크로서비스를 사용해 반응형 AI플랫폼을 구축했다. 라마, 마이크로소프트(MS) 파이 소형언어모델(sLLM) 제품군, 구글 젬마, 미스트랄 등을 지원하며 사용자는 API를 통해 자체 환경 내에서 에이전트 구축 워크플로우의 전 과정을 실행할 수 있다.

관련기사

저작권자 © ITBizNews 무단전재 및 재배포 금지