AWS, 딥시크 R1 서비스 개시…생성AI 활용 확장

최대 95% 비용절감 효과 기대

2025-02-04     오현식 기자
지난달 7일(현지시간) 미국 라스베이거스에서 열린 CES 2025 현장에 마련된 아마존 부스 [사진=EPA]

아마존웹서비스(AWS)가 중국 AI스타트업 딥시크의 R1 모델을 ‘아마존 베드록’과 ‘아마존 세이지메이커AI’에서 제공한다고 발표했다. 딥시크 R1은 최근 저비용 학습으로 고성능을 발휘하도록 개발돼 주목받는 인공지능(AI) 모델이다. 

딥시크는 지난달 20일 R1과 R1제로, R1디스틸 등을 발표한 데 이어 같은달 27일에는 비전 기반 야누스-프로7B 모델을 추가했다. 딥시크가 공개한 자료에 다르면, 이들 모델은 강화학습 기법을 적용해 우수한 추론 능력을 갖췄고 기존보다 90~95% 비용 절감과 비용 효율성을 제공한다.

AWS는 고객이 딥시크 R1모델을 다양한 방식으로 활용할 수 있도록 아마존 베드록에서 API를 통한 사전학습된 모델을 쉽게 통합할 수 있도록 돕고 아마존 세이지메이커AI를 통해 맞춤형 학습과 배포가 가능하도록 지원한다.

AWS는 또한 ‘AWS 트레이니움’과 ‘AWS 인퍼런시아’를 활용하면, 딥시크 R1디스틸 모델을 더욱 경제적으로 운영할 수 있다고 설명했다. 

딥시크 R1은 현재 AWS에서 4개의 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스에서는 모델 카탈로그에서 딥시크 R1을 검색해 배포할 수 있으며, 아마존 세이지메이커 점프스타트를 통해 머신러닝(ML) 허브에서 간단한 원클릭으로 배포·활용이 가능하다. 

아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크 R1디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있고 AWS EC2 Trn1 인스턴스를 사용하면 딥시크 R1디스틸 모델을 AWS 트레이니움, AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

한편, AWS는 보안성과 확장성을 강화하기 위해 ‘아마존 베드록 가드레일’을 활용할 것을 권유했다. 이를 통해 생성AI 애플리케이션의 입·출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다고 AWS는 부연했다.

AWS는 "딥시크 R1 모델을 통해 고객들이 AI기술을 더 효과적으로 활용하고 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 지원할 예정"이라고 전했다.