[IT비즈뉴스 최태우 기자] 네이버가 10일 인공지능(AI) 플랫폼 '클로바(Clova)'와 '파파고(Papago)'의 광학문자인식(Optical Character Recognition, OCR) 연구팀이 국제패턴인식협회(IAPR)가 주관하는 글로벌 경진대회 'ICDAR Robust Reading Competition'에서 1위를 기록했다고 밝혔다.

ICDAR Robust Reading Competition은 디지털 이미지와 비디오 상에서 텍스트를 감지/인식하는 기술 분야에서 권위 있는 국제 규모의 경진대회이다. 'COCO-dataset'을 비롯한 여러 데이터의 문자 감지/인식 능력을 평가, 2011년 대회 기록을 기점으로 누적해 순위를 기록하는 형식으로 진행된다.

OCR은 크게 이미지에서 ▲문자의 위치를 찾는 검출 기술 ▲문자가 무엇인지 알아내는 인식 기술로 나눠진다. 네이버는 이번 대회에서 문자 검출 부문 기술력에서 알리바바(Alibaba), 텐센트(Tencent), 센스타임(Sensetime) 등 관련기업들 보다 높은 점수를 기록했다고 설명했다.

IAPR이 발표한 자료에 따르면 2017년에 공개된 다국어 데이터 기반의 문자 영역 검출 과제(Multi-Lingual scene Text(MLT) – Localization)에서 네이버가 73.68%를 기록하며 1위를 차지했다.

국제패턴인식협(IAPR)가 주관하는 'ICDAR Robust Reading Competition' 대회 홈페이지에 개제된 순위도

해당 기술은 영어를 포함한 라틴 계열의 문자와 한국어, 일본어, 중국어, 아랍어, 뱅골어, 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로 단일 언어를 검출하는 것 보다 고도화된 기술력이 요구되는 분야다.

2017년 다국어 데이터 기반의 문자 종류 구분에 대한 과제(Multi-Lingual scene Text (MLT) - Script Identification)에서도 네이버 클로바 팀에서 인턴으로 재직하고 있는 정성효 학생(고려대 주재걸 교수 연구실 소속) 주도로 연구한 방식이 89.01%를 기록하면서 1위를 차지했다.

구분 기술은 다국어 문자 검출 기술과 연관된 기술이다. 검출된 영역에 해당하는 총 7개의 문자 종류 중 하나의 문자 종류로 분류하는 기술이다.

해당 연구를 진행한 네이버 클로바 VISION팀의 이활석 연구자는 “OCR 분야의 공신력 있는 경진대회에서 좋은 성과를 기록하며 글로벌 기업 사이에서 경쟁력을 갖춰가고 있다”며 “지속적으로 OCR 기술을 고도화하면서 더욱 다양한 분야에서 활발히 활용될 수 있도록 연구를 이어갈 것”이라고 밝혔다.

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지