엔비디아와 엔터프라이즈급 솔루션 공동 설계
생성AI 애플리케이션 개발·배포 지원

HPE가 엔비디아와 공동 엔지니어링한 풀스택 생성AI 솔루션을 발표했다. [사진=HPE]
HPE가 엔비디아와 공동 엔지니어링한 풀스택 생성AI 솔루션을 발표했다. [사진=HPE]

HPE가 엔비디아와 공동 엔지니어링한 풀스택 생성형 인공지능(AI) 솔루션 등 AI 네이티브 포트폴리오를 업데이트했다. 엔비디아 GTC에서 발표된 이번 업데이트에는  HPE 머신러닝 추론 소프트웨어 프리뷰 버전 ▲엔터프라이즈급 검생증강생성(RAG) 레퍼런스 아키텍처 ▲엔비디아 블랙웰 플랫폼 기반 제품 개발 지원 등이 포함됐다.

안토니오 네리 HPE CEO는 “생성AI의 미래를 실현하고 AI 생명주기 전반을 다루기 위한 솔루션은 설계부터 하이브리드로 제작되어야 한다”며 “HPE와 엔비디아는 공동 설계한 AI 소프트웨어와 하드웨어 솔루션을 지속 선보여 신속하게 생성AI 개발·배포가 이뤄지도록 도울 것”이라고 강조했다. 

대규모 AI 모델의 개발·훈련을 위한 생성AI용 HPE 슈퍼컴퓨팅 솔루션은 엔비디아 칩으로 구동되며 최대 168개의 엔비디아 GH200 그레이스 호퍼 슈퍼칩을 통해 생성AI와 딥러닝 프로젝트 개발을 가속화할 수 있게 한다.

설치에서부터 설치까지 모든 서비스가 제공되는 턴키 솔루션으로 제공돼 대규모언어모델(LLM), 추천 시스템, 벡터 데이터 베이스 등 생성AI와 딥러닝 프로젝트를 더 빠르게 추진하고 AI 모델 훈련 시간도 2~3배 단축한다고 HPE는 설명했다.

또 HPE 그린레이크에서 제공되는 HPE 생성AI용 엔터프라이즈 컴퓨팅 솔루션은 엔비디아와 공동 엔지니어링으로 사전 구성돼 생성AI 애플리케이션 제작을 위해 필요한 정확한 컴퓨팅, 스토리지, 소프트웨어, 네트워킹, 컨설팅 서비스를 모두 제공하는 점도 특징이다.

프라이빗 데이터 기반의 파운데이셔널 모델 제작을 위한 속도, 규모, 관리 기능은 물론 하이브리드 클라우드 모델 내 생성AI 애플리케이션 배포까지 지원한다. 

HPE에 따르면, 이 솔루션을 실행하는 700억 개의 파라미터를 가진 라마2 모델의 미세 조정 시간은 노드 수에 따라 선형적으로 감소해 16노드 시스템에서는 6분이 소요되며 이를 통해 고객은 버추얼 어시스턴트, 지능형 챗봇, 기업용 검색과 같은 AI 애플리케이션으로 비즈니스 생산성을 개선해 가치 실현을 빠르게 달성할 수 있다.

프리뷰 버전으로 제공되는 HPE 머신러닝 추론 소프트웨어는 빠르고 안전하게 머신러닝 모델을 대규모로 배포할 수 있게 하며, 엔비디아 네모 리트리머 마이크로 서비스 아키텍처에 기반한 엔터프라이즈 RAG용 레퍼런스 아키텍처는 프라이빗 데이터를 기반으로 하는 생성AI 애플리케이션의 빠른 구축·배포를 지원한다.

관련기사

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지