‘아마존 베드록’ 선택지 확장
이미지·비디오 생성 추가 모델 2종 동시 공개
아마존웹서비스(AWS)가 ‘AWS 리인벤트’에서 차세대 파운데이션 모델(FM) ‘아마존 노바’를 발표했다. 아마존 노바는 ‘아마존 베드록’ 환경에서 운영되며 ▲아마존 노바 마이크로 ▲아마존 노바 라이트 ▲아마존 노바 프로 ▲아마존 노바 프리미어 등 4개 모델을 포함한다.
로힛 프라사드 아마존 인공일반지능(AGI) 수석부사장은 "아마존 내부적으로 약 1,000개의 생성형 인공지능(AI) 애플리케이션을 진행 중”이라며 “아마존 노바 모델은 내외부 개발자들의 이 과제 해결을 돕고 지연시간, 비용효율성, 맞춤화, 검색 증강 생성(RAG), 에이전트 기능에서 의미 있는 진전을 이루면서 강력한 인텔리전스와 콘텐츠 생성을 제공하고자 한다”고 말했다.
아마존 노바 4개 모델 중 아마존 노바 마이크로는 낮은 비용으로, 가장 낮은 지연 시간의 응답을 제공하는 텍스트 전용 모델이다.
노바 라이트는 저비용 멀티모달 모델, 노바 프로는 고성능 멀티모달 모델이며, 노바 프리미어는 가장 강력한 멀티모달 모델이다. 이 중 노바 프리미어는 내년 1분기 출시될 예정이다.
아마존에 따르면, 노바 마이크로는 11개 벤치마크에서 메타의 라마3.1 8B와 비교해 동등하거나 더 나은 성능을 보였으며, 12개 벤치마크에서는 구글 제미나이1.5 플래시-8B보다 동등하거나 더 나은 성능을 보였다.
노바 마이크로는 초당 210개의 출력 토큰이라는 속도를 지녀 빠른 응답이 필요한 애플리케이션에 이상적이다.
아마존 노바 라이트도 오픈AI GPT-4o 미니와 비교해 19개 중 17개의 벤치마크에서, 구글 제미나이 1.5 플래시-8B와 비교해 21개 중 17개의 벤치마크에서 동등 혹은 우위의 성능을 보였으며, 특히 비디오, 차트, 문서 이해도에서 높은 경쟁력을 과시했다.
아마존 노바 프로는 오픈AI의 GPT-4o와 비교해 20개 중 17개의 벤치마크에서, 구글의 제미나이 1.5 프로(Gemini 1.5 Pro)와 비교해 21개 중 16개의 벤치마크에서 동등하거나 더 나은 성능을 보였으며, 텍스트와 시각적 인텔리전스 벤치마크에서의 정확성 외에도 지시사항 준수와 멀티모달 에이전트 워크플로우에서 앞선 성능을 기록했다.
아마존 노바 마이크로와 라이트, 프로는 200개 이상의 언어를 지원하며, 노바 마이크로는 128K 입력 토큰의 컨텍스트 길이를, 아마존 노바 라이트와 아마존 노바 프로는 300K 토큰 또는 30분의 비디오 처리를 지원하는 컨텍스트 길이를 제공한다. AWS는 2025년 초 2M 이상의 입력 토큰 컨텍스트 길이를 지원할 예정이다.
모든 아마존 노바 모델은 완전관리형 서비스인 아마존 베드록과 통합돼 고객의 FM 선택폭을 넓힌다. 또 맞춤형 미세조정과 더 큰 고성능 교사 모델에서 더 작고 효율적인 모델로 특정 지식을 전달할 수 있는 증류(distillation)도 지원한다.
한편 AWS는 ▲스튜디오급 이미지 생성 모델인 아마존 노바 캔버스 ▲스튜디오급 비디오 생성 모델인 아마존 노바 릴 등 2개 추가 모델도 함께 공개했다. 노바 캔버스는 텍스트나 이미지 프롬프트로부터 전문가급 이미지를 생성하며, 텍스트와 이미지로부터 쉽게 고품질 비디오를 생성할 수 있게 한다.