한국어·영어 요약·번역 제공, 추후 태국어·일본어 등 확장

업스테이지가 아마존웹서비스(AWS) 기반의 소형언어모델(SLM) ‘솔라 미니’를 출시했다. 솔라 미니는 아마존 세이지메이커 점프스타트, AWS 마켓플레이스에서 제공되며, 한국어와 영어 문장을 이해하고, 요약하거나 번역할 수 있다.

언어 모델은 컨텍스트, 메모리 기능, 텍스트 생성을 제공해 생성형 인공지능(AI) 서비스를 가능케 한다. SLM은 수천억 개의 파라미터를 사용하는 대규모언어모델(LLM)와 비교해 적은 200억개 미만의 파라미터를 사용해 AI 운영에 필요한 리소스와 비용 부담을 낮춘다. 솔라 미니의 경우, 약 107억개의 파라미터로 구성돼 있다. 

다양한 언어 작업을 수행하는 다목적 모델로 개발된 솔라는 미세 조정이 가능해 기업 환경에 쉽게 맞춤화할 수 있는 점이 특징이다. 기업이 맞춤형 모델 개발을 위해 처음부터 훈련시킬 필요 없이 미세 조정으로 생성AI를 쉽게 시작할 수 있으며, 산업별 사용 사례에 적합한 새로운 애플리케이션을 출시도 용이하다. 

솔라 미니는 파운데이션 모델(FM)을 제공하는 머신러닝(ML) 허브인 아마존 세이지메이커 점프스타트, 제3자 소프트웨어 공급업체의 솔루션을 배포하는 AWS 마켓플레이스에서 제공된다. 메타버스엔터테인먼트, 쿼라, 커넥트웨이브, 콴다 등과 같은 도메인별 학습 데이터를 활용해 솔라 미니를 미세 조정할 수 있다.

김성훈 업스테이지 대표는 “업스테이지는 사업 시작 단계부터 글로벌 AI 플레이어로 거듭날 수 있도록 준비해왔다”며 “아마존 세이지메이커 점프스타트에서의 솔라 미니 모델 출시로 전세계 기업들이 한국에서 가장 높은 다목적성을 갖춘 LLM을 이용할 수 있는 새로운 가능성을 열게 됐다”고 말했다. 

업스테이지는 솔라 미니를 학습시키기 위해 우수한 컴퓨팅 성능과 비용 효율성을 갖춘 AWS를 선택했다. 한국어에 특화된 LLM 개발을 위해 업스테이지가 설립한 업계 얼라이언스인 1T클럽에서 제공한 데이터와 ML 모델 개발·배포 서비스인 아마존 세이지메이커를 활용했다.

텍스트, 서적, 뉴스 기사, 보고서, 논문 등 저작권이 없는 다양한 고품질 한국어 학습 데이터로 구성된 1T클럽의 데이터는 문화적 뉘앙스에 대한 솔라 미니의 이해를 발전시키는 동시에 응답의 정확도를 높여 잘못되거나 부적절한 답변을 생성하는 'AI 할루시네이션’을 방지한다. 

윤정원 AWS코리아 공공부문 대표는 "AWS상에 구축된 업스테이지의 솔라 미니는 모든 규모의 기업이 다양한 지역의 요구사항에 따라 생성AI를 쉽게 도입할 수 있도록 지원하는 강력한 솔루션”이라며, “AWS의 안전하고 확장 가능한 스택은 AI 제품을 확장하고, 다양한 산업에 생성AI를 애플리케이션에 쉽게 배포할 수 있게 한다”고 말했다.

관련기사

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지