상단여백
HOME 임베디드 컴퓨팅 포토
삼성·네이버, AI 기계독해·문자인식(OCR) 기술 고도화 추진 中국제 규모 기술·연구 테스트에서 1위, 관련 기술 고도화 진행

[IT비즈뉴스 김진수 기자] 인공지능(AI) 기술이 산업 전반의 하드웨어(HW) 시스템, 애플리케이션에 접목되면서 서비스 고도화를 견인하고 있다.

음성인식기술을 통해 스마트홈 서비스를 제어하고 사용자의 행동, 사용한 문자 패턴을 분석한 데이터를 바탕으로 맞춤형 서비스를 찾아주는(검색, 큐레이션) 지능형서비스에 접목되면서 국내 기업들 또한 독해·비전인식 기술 고도화에 나서고 있어 주목된다.

업계에 따르면 삼성전자의 세트부문 선행 연구개발 조직인 ‘삼성리서치’는 최근 마이크로소프트(MS)가 주최하는 ‘마르코(MSMARCO)’ 기계독해 테스트와 워싱턴대학교가 진행하는 트리비아(TriviaQA)’ 테스트에서 1위를 기록했다.

기계독해는 AI 알고리즘이 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술을 말한다. 삼성리서치는 이번 테스트에서 자체 AI 알고리즘(ConZNet)으로 테스트에 참가했다. ‘Context Zoom-in Network’의 약자인 콘즈넷(ConZNet)은 문맥(Context)을 이해하는 것이 중요한 자연어(말) 처리 알고리즘이다.

김지희 삼성리서치 언어이해랩장 [source=Samsung newsroom]

김지희 삼성리서치 언어이해랩장(상무)은 “콘즈넷은 웹에서 어떤 형태로 질문하고 답하는지와 자연어 사용 형태까지 고려하고 강화학습을 통해 기술 고도화를 추진해 왔다”며 “챗봇과 같은 AI 기반 고객응대가 화두인 현재 삼성전자의 하드웨어, 서비스에 탑재되는 AI 서비스에 녹아들 수 있도록 기술 고도화를 추진 중”이라고 말했다.

네이버는 글자와 이미지를 인식·분석하는 컴퓨터 비전(VISION), 광학문자인식(Optical Character Recognition, OCR) 기술 고도화를 추진 중이다. 최근에는 네이버 클로바·파파고의 OCR연구팀이 국제패턴인식협회(IAPR)이 주관하는 ‘ICDAR Robust Reading Competition’에서 1위를 기록하면서 눈길을 끌었다.

OCR은 크게 이미지 부문에서 ▲문자의 위치를 찾는 검출 기술 ▲문자가 무엇인지 알아내는 인식 기술로 나눠진다.

네이버는  이번 테스트로 치러진 다국어 데이터 기반의 문자 영역 검출 과제(Multi-Lingual scene Text(MLT) – Localization)에서 73.68%를 기록하며 1위를 차지했다.

국제패턴인식협회(IAPR)이 주관하는 ‘ICDAR Robust Reading Competition’ 홈페이지에 개제된 순위도. 네이버는 문자 검출 부문 기술력에서 알리바바(Alibaba), 텐센트(Tencent), 센스타임(Sensetime) 등 관련기술 기업 대비 높은 점수를 기록했다.

해당 기술은 영어를 포함한 라틴 계열의 문자와 한국어, 일본어, 중국어, 아랍어, 뱅골어, 특수 기호 등 총 7개의 문자 영역을 검출하는 기술이다. 단일 언어를 검출하는 것 보다 고도화된 기술력이 요구되는 분야다.

다국어 데이터 기반의 문자 종류 구분에 대한 과제(Multi-Lingual scene Text (MLT) - Script Identification)에서도 클로바 팀이 연구한 방식이 89.01%를 기록하면서 1위를 차지했다. 

이활석 네이버 클로바 비전팀 연구자는 “OCR 분야의 공신력 있는 경진대회에서 좋은 성과를 기록하며 글로벌 기업 사이에서 경쟁력을 갖춰가고 있다”며 “지속적으로 OCR 기술 고도화를 추진하면서 다양한 분야에서 활발히 활용될 수 있도록 연구를 이어갈 계획”이라고 말했다.

김진수 기자  embe@itbiznews.com

<저작권자 © IT비즈뉴스-아이티비즈뉴스, 무단 전재 및 재배포 금지>

김진수 기자의 다른기사 보기
icon인기기사
여백
여백
여백
여백
Back to Top