12일 시즌2 개편, 추론·감성이해·무해성 능력 등으로 지표 개선
한국지능정보사회진흥원(NIA)이 업스테이지와 공동 운영하는 ‘Open Ko-LLM 리더보드’가 시즌2로 전면 개편된다고 12일 밝혔다.
Open Ko-LLM 리더보드는 지난해 9월 민관협력을 통해 개설된 국내 최대 개방형 한국어 대규모언어모델(LLM) 평가 체계다. 산·학·연 각계 분야에서 지난달 말 기준 1,700개가 넘는 LLM 모델이 제출됐다.
LLM 기술이 빠르게 발전하면서 그간 1년 전에 만들어진 리더보드 평가지표(벤치마크)의 개선이 필요하다는 필요하다는 목소리가 나왔다.
글로벌 Open LLM 리더보드를 운영하는 허깅페이스도 지난 6월에 평가지표를 새로 개편한 리더보드 시즌2를 공개한 바 있다.
NIA와 업스테이지는 LLM 기술 변화와 허깅페이스의 리더보드 개편을 반영해 12일부터 새로운 성능 평가지표를 적용한 ‘Open Ko-LLM 리더보드 시즌2’ 운영을 시작한다.
시즌2에서는 기존에 운영되던 평가지표를 전면 폐지하고 AI 데이터 전문기업인 플리토와 셀렉트스타, 카이스트(KAIST) AI대학원이 참여해 추론능력 지표, 감성 지표, 무해성 지표 등 9개의 새로운 평가지표를 구축, 이를 본격 적용한다.
NIA 황종성 원장은 “리더보드는 민관 협업을 통해 한국어 LLM 생태계 조성에 크게 기여해 왔다”며 “이번 시즌2 개편을 통해 한국어 LLM 기술이 세계적 수준에 한발 더 올라설 수 있는 계기가 되기를 기대한다”고 밝혔다.
공동 운영기관인 업스테이지 박찬준 리더는 “많은 전문기업과 학계의 참여로 시즌2를 빠르게 준비할 수 있었으며 시즌2에서도 지속적인 관심과 참여를 부탁한다”고 전했다.
관련기사
- “생성AI 이슈, 최우선 과제지만”…포괄적 거버넌스 정책 수립은 ‘미비’
- “음성 발화 분석으로 치매 예측”…ETRI, 모니터링 앱 개발
- IBM 왓슨x, 라마3.1 등 오픈소스 모델 지원
- 오픈AI, 자체 개발 검색엔진 ‘서치GPT’ 프로토타입 공개
- 엔비디아, AI파운드리·NIM 추론 마이크로서비스 정식 공개
- 솔트룩스, AI 기반 특허심사 업무 지원 서비스 개발 추진
- 기업 10곳 중 9곳 “2회 이상 아이덴티티 침해 경험”
- 다쏘시스템, 미스트랄AI와 파트너십 체결
- 카카오엔터, 엔비디아 GPU 인스턴스 활용 세미나 성료
- AMD, 유럽 최대 민간 AI연구소 ‘사일로AI’ 인수한다