상단여백
HOME 컴퓨팅인사이트 임베디드컴퓨팅
카카오 AI 언어모델, 한국어 기계독해 능력 평가서 1위 차지LG CNS 주최 평가에서 인간 수준의 판별·독해능력 보여

[IT비즈뉴스 최태우 기자] 카카오가 31일 자체 개발한 인공지능(AI) 언어모델이 한국어 학습 데이터 ‘KorQuAD(The Korean Question Answering Dataset)’를 바탕으로 한 기계독해 능력 평가에서 91.85점을 받으며 1위를 차지했다고 밝혔다. 

이는 평가 주최인 LG CNS가 인간의 문장 판별·독해 능력 수준(Human Performance)이라고 밝힌 91.20점보다 0.65점 높은 수치다. 

LG CNS가 운영하는 기계독해 능력 평가는 스탠포드대학에서 시작된 AI 언어지능 연구용 질의응답 학습 데이터셋인 SQuAD(The Stanford Question Answering Dataset)와 동일한 방식으로 구현된다. 

KorQuAD(The Korean Question Answering Dataset) 평가 순위도

앞서 LG CNS는 지난해 12월 한국어 학습을 위한 데이터(KorQuAD)를 구축, 오픈소스로 공개한 바 있다.

평가는 데이터셋에서 추출한 내용을 질문으로 제시하고 이에 대해 개발 모델이 답을 찾아내는 방식으로 진행된다. 

예를 들어 “아이유는 1993년 5월 16일 서울특별시에서 태어났으며, 경기도 하남시와 의정부시를 거쳐 서울특별시 광진구에서 자랐다. 초등학교는 하남시의 하남천현초등학교에서 3학년까지 다니다가 서울 광진구의 서울양남초등학교로 전학가 졸업하였다”의 지문이 제공되고 “아이유가 졸업한 초등학교는 어디인가?”라는 질문에 대해 “서울양남초등학교”라는 정답을 찾아내는 식이다.

카카오의 AI 언어모델(모델명: BERT LM fine-tuned (single) + KHAIII)은 구글의 AI 언어모델 BERT(Bidirectional Encoder Representations from Transformers)에 카카오의 형태소 분석기인 카이(Kakao Hangul Analyzer III, khaiii)를 접목한 것으로 조사의 사용과 어미의 다양한 변형 등 한국어의 특성에 최적화된 점이 특징이다. 

카이(khaiii)의 CNN 모델 네트워크 구조도 (사진을 클릭하면 크게 보입니다.)

앞서 카카오 또한 지난해 말 딥러닝 기반의 형태소 분석기인 카이(khaiii)를 오픈소스로 공개한 바 있다.

카카오 자연어처리파트의 김응균 파트장은 “이번 평가 결과는 카카오의 인공지능 자연어 처리 기술을 활용해 인간의 독해 능력을 넘어서는 최초의 모델을 구현했다는 점에 주목해야 한다”며 “개발된 언어모델 기술을 스마트스피커인 카카오미니에 적용하기 위한 연구를 진행 중”이라고 밝혔다.

최태우 기자  taewoo@itbiznews.com

<저작권자 © IT비즈뉴스-아이티비즈뉴스, 무단 전재 및 재배포 금지>

최태우 기자의 다른기사 보기
icon관련기사 icon네이버랩스·LG전자, 위치·이동 플랫폼 ‘xDM’ 공동연구 ‘맞손’ icon“IoT 보안, 시스템·애플리케이션 개발 초기단계에 적용해야” icon나무기술·쌍용정보통신, 클라우드 비즈니스 상호협력 MOU 체결 icon“미래 성장동력 확보 위한 R&D 역량 강화한다” icon네이버 D2SF, 자율주행·AI 2개 테크 스타트업 신규투자 단행 iconFPGA 강점 살린 자일링스, ‘오토모티브 매출 키운다’ iconAI 기업 경쟁력 키운다…정부, ‘인공지능 허브’ 사업 확대 추진 icon인공지능(AI) 기술 도입 기업, 전년비 3배 증가 icon구글스타트업 캠퍼스, 상반기 5개 신규 입주사 선정 발표 icon인공지능(AI)이 인간의 감성을 이해한다?…“물론, 가능하다!” icon카카오, CNN 기반 형태소 분석기술 ‘카이(khaiii)’ 오픈소스 배포 iconAI 스타트업 ‘스켈터랩스’, 효성ITX '고객상담 솔루션 개발·공급' 계약 체결 icon고문서 해석에 사용되는 딥러닝 기술 ① icon카카오톡 알림톡, 신용카드 결제 알림 서비스 시작 icon카카오 지난해 매출 역대 최고치 기록, 영업익은 56% 감소 icon레드햇, 인프라스트럭처 관리 툴 ‘클라우드폼즈’ 최신버전 발표 icon머신러닝(ML) 개발자 5만명 키운다는 구글, ‘협업 통한 생태계 만든다’ icon캐나다 인공지능 랩 ‘에이미(AMII)’ 합류한 마인즈랩, “딥러닝 고도화 추진” icon구글, 내년 초 GCP 서울 리전 개설…클라우드 비즈니스 강화 icon[2019-18주차] 업계 이모저모…블록체인 기술연구 협력 발표한 테라 外 icon한국어 인식 AI 서비스, 더 고도화된다…한국어 특성 고려한 언어모델 공개 icon'한국형 AI 서비스' 개발 지원, 한국어 음성·영상데이터 250만개 풀린다
icon인기기사
Back to Top