최근 한국어 논리 추론 AI모델인 ‘DNA-R1’을 공개한 디노티시아가 한양대학교 AIHA연구실과 협력 연구를 통해 개발한 인공지능(AI) 양자화(Quantization) 알고리즘 평가 플랫폼(QLLM-INFER)을 오픈소스로 공개했다. 이 플랫폼은 아파치 2.0 라이선스를 적용해 깃허브에서 누구나 자유롭게 사용할 수 있다.

최근 챗GPT와 같은 대규모언어모델(LLM)이 주목받으면서 AI기술의 활용 범위가 넓어지고 있으나 이같은 모델은 높은 연산량과 메모리 사용으로 인해 실제 서비스나 개인용 컴퓨터·스마트폰에 적용하기 어렵다. 

양자화는 AI 모델의 계산 정밀도를 낮춰 더 빠르게 만드는 기술로 큰 숫자를 작은 숫자로 압축하는 방식이다. 이를 통해 AI 모델은 원래 성능을 유지하면서도 메모리 사용량과 연산 속도를 크게 줄일 수 있다.

지금까지 다양한 양자화 알고리즘이 서로 다른 환경과 조건에서 평가돼 어느 기술이 더 좋은 지 객관적으로 비교하기 어려웠다. 

디노티시아와 한양대는 이 문제를 해결하고자 표준화된 환경에서 알고리즘 성능을 정확히 비교할 수 있는 플랫폼을 구축하고 최근 3년 간 가장 많이 주목받은 양자화 기술 8개를 선정해 동일한 조건에서 객관적으로 평가했다.

특히 이 플랫폼은 ▲가중치와 활성화 값을 모두 줄이는 방식 ▲가중치만 줄이는 방식 ▲AI가 긴 입력을 처리할 때 임시 저장하는 공간(KV캐시)을 줄이는 방식 등 3개 유형으로 나눠 알고리즘 성능을 분석했다.

디노티시아 정무경 대표는 “LLM 서비스가 널리 상용화되기 위해서는 양자화를 통한 모델 경량화가 필수지만 어떤 양자화 기술이 타겟 응용과 시스템에 유효한 지 판단이 어렵다”며, “QLLM-INFER는 양자화 알고리즘의 성능을 객관적이고 투명하게 비교할 수 있는 오픈소스 플랫폼”이라고 설명했다.

한양대 최정욱 융합전자공학과 교수는 “지금까지 양자화 기술은 연구마다 기준이 달라 객관적 비교가 어려웠다”며, “이번 플랫폼은 AI 연구에 처음으로 표준화된 평가 기준을 제시했다는 점에서 학문적으로 의미가 크다”고 말했다.

관련기사

저작권자 © ITBizNews 무단전재 및 재배포 금지