AWS, 블랙웰 GPU-ARM CPU 통합 슈퍼칩 ‘GB200’ 도입 예정
엔비디아가 18일(현지시간) 미국 캘리포니아 산호세 SAP센터에서 개발자 행사 ‘GTC 2024’ 현장에서 차세대 아키텍처 ‘블랙웰(Blackwell)’을 정식 공개했다.
엔비디아는 블랙웰을 “전 세대 모델보다 최대 25배 적은 비용과 전력으로 조 단위 대규모언어모델(LLM)에서 실시간 생성AI를 구축하고 실행하도록 돕는다”며 “칩이 아닌 플랫폼”이라고 강조했다.
블랙웰은 게임 이론과 통계학을 전공한 수학자이자 흑인으로는 최초로 미국국립과학원(National Academy of Sciences)에 입회한 데이비드 헤롤드 블랙웰(David Harold Blackwell)에서 따왔다. 2년 전 출시된 엔비디아 호퍼(Hopper)를 이은 후속 아키텍처다.
2,080억개의 트랜지스터를 탑재한 블랙웰은 GPU 다이가 초당 10테라바이트(TB)의 칩-투-칩(chip-to-chip) 링크로 연결됐다. 공정은 TSMC가 맡는다.
엔비디아 텐서RT-LLM(TensorRT-LLM), 네모 메가트론(NeMo Megatron) 프레임워크에 통합된 알고리즘을 기반으로 새로운 4비트 부동 소수점 AI 추론이 가능하다는 게 엔비디아의 설명이다. 트랜스포머 기반 AI 구동을 위해 제작된 트랜스포머 엔진이 탑재됐다.
젠슨 황 엔비디아의 창립자 겸 CEO는 “엔비디아는 지난 30년 동안 딥러닝, AI와 같은 혁신을 실현하기 위해 가속컴퓨팅을 추구해 왔다”며 “생성AI는 시대를 정의하는 기술이다. 블랙웰 GPU는 이 새로운 산업 혁명을 구동하는 엔진”이라고 말했다.
이날 현장에서는 차세대 AI칩 ‘B200’도 공개됐다. 최신 AI칩으로 평가받는 호퍼 아키텍처 기반의 H100의 성능을 뛰어넘는 차세대 AI칩이라는 게 엔비디아의 설명이다.
엔비디아가 공개한 제원에 따르면, 블랙웰을 기반으로 설계된 B200은 전 세대(H100) 대비 최대 30배 높은 성능을 제공하면서도 비용과 에너지 소비는 최대 25분의 1 수준이다. 시장 공급가격은 알려지지 않았다.
2개의 B200 블랙웰 GPU와 ARM 코어가 결합된 슈퍼칩(GB200)도 공개했다. 엔비디아에 따르면, 아마존웹서비스(AWS)가 2만개의 GB200 칩으로 서버 클러스터를 구축할 예정이다.
젠슨 황 CEO는 “엔비디아는 단순한 칩(실리콘) 공급사가 아닌 마이크로소프트(MS), 애플 등과 같은 플랫폼 공급사로 전환하고 있다”며 “블랙웰은 칩이 아닌 플랫폼”이라고 강조했다.
관련기사
- [그것을 알려주마] 폭풍질주 엔비디아, 애플 기업가치 넘어설까?
- 스노우플레이크, 미스트랄AI와 협력…생성AI 앱 개발 지원 확대
- 넷앱, 엔비디아와 파트너십 강화…생성AI 지원 맞춤 기능 공개
- KAIST, 초저전력 AI칩용 ‘상보형-트랜스포머’ 개발
- SKT, 글로벌 협력으로 AI 데이터센터 공략 ‘박차’
- AI 규제안 앞다퉈 발의하는 美 주정부…관련 규제 논의 본격화
- 삼성, ‘AI-RAN 얼라이언스’에 창립멤버 참여
- 생성AI 열풍 속 엔비디아 ‘질주’…훈풍에 HBM도 ‘주목’
- 인텔, HPC 클러스터 ‘카디널’ 정식 공개
- SKT, GPU 클라우드 기업 람다에 투자…AI DC 사업 본격화