12일 시즌2 개편, 추론·감성이해·무해성 능력 등으로 지표 개선

한국지능정보사회진흥원 대구본원 전경
한국지능정보사회진흥원 대구본원 전경

한국지능정보사회진흥원(NIA)이 업스테이지와 공동 운영하는 ‘Open Ko-LLM 리더보드’가 시즌2로 전면 개편된다고 12일 밝혔다.

Open Ko-LLM 리더보드는 지난해 9월 민관협력을 통해 개설된 국내 최대 개방형 한국어 대규모언어모델(LLM) 평가 체계다. 산·학·연 각계 분야에서 지난달 말 기준 1,700개가 넘는 LLM 모델이 제출됐다.

LLM 기술이 빠르게 발전하면서 그간 1년 전에 만들어진 리더보드 평가지표(벤치마크)의 개선이 필요하다는 필요하다는 목소리가 나왔다.

글로벌 Open LLM 리더보드를 운영하는 허깅페이스도 지난 6월에 평가지표를 새로 개편한 리더보드 시즌2를 공개한 바 있다. 

NIA와 업스테이지는 LLM 기술 변화와 허깅페이스의 리더보드 개편을 반영해 12일부터 새로운 성능 평가지표를 적용한 ‘Open Ko-LLM 리더보드 시즌2’ 운영을 시작한다.

시즌2에서는 기존에 운영되던 평가지표를 전면 폐지하고 AI 데이터 전문기업인 플리토와 셀렉트스타, 카이스트(KAIST) AI대학원이 참여해 추론능력 지표, 감성 지표, 무해성 지표 등 9개의 새로운 평가지표를 구축, 이를 본격 적용한다.

NIA 황종성 원장은 “리더보드는 민관 협업을 통해 한국어 LLM 생태계 조성에 크게 기여해 왔다”며 “이번 시즌2 개편을 통해 한국어 LLM 기술이 세계적 수준에 한발 더 올라설 수 있는 계기가 되기를 기대한다”고 밝혔다.

공동 운영기관인 업스테이지 박찬준 리더는 “많은 전문기업과 학계의 참여로 시즌2를 빠르게 준비할 수 있었으며 시즌2에서도 지속적인 관심과 참여를 부탁한다”고 전했다.

관련기사

저작권자 © ITBizNews 무단전재 및 재배포 금지