[IT비즈뉴스 김진수 기자] 한국전자통신연구원(ETRI)이 태국어와 말레이어, 인도네시아어의 음성 데이터베이스(DB)와 영어대역문장 DB를 일반에 배포한다. 음성인식·번역엔진의 해외 의존도를 줄이고 해당 언어를 활용한 서비스 개발에 도움이 될 것으로 기대된다.

ETRI가 이번에 일반에 공개하는 음성DB는 인공지능(AI) 스피커, 내비게이션, IoT 서비스에 적용되는 음성인식·번역 SW개발에 기초가 되는 자료다. 좋은 품질의 많은 언어DB를 구축하는 것이 서비스 다양화와 고부가가치 서비스기술 창출의 핵심이라 할 수 있다.

이번에 배포되는 자료는 ▲태국어 ▲말레이어 ▲인도네시아어 ▲아랍어 ▲베트남어 '대화체 음성DB 200만 발화' ▲영어–태국어 ▲영어–말레이어 ▲영어–인도네시아어 ▲영어–아랍어 ▲영어–베트남어 '대화체 대역문장DB 300만 문장 등이다.

ETRI가 배포할 예정인 언어·음성 DB의 모습 (왼쪽부터 대화형 언어 발화 음성 파형, 대화형 문장)

앞서 ETRI는 2011년부터 한·영·일·중 다국어 언어음성DB를, 2014년에는 프랑스어, 2015년에는 독일어, 러시아어, 아랍어, 베트남어를 구축·배포한 바 있다. 태국어, 말레이어, 인도네시아어 자료는 이번에 국내 최초로 제공된다.

앞서 공개된 아랍어와 베트남어는 ETRI 기존 자료에 데이터양을 늘려 배포되면서 서비스를 개발하는 국내 기업들은 DB구축 비용을 절감할 수 있을 것으로 기대된다.

ETRI는 DB확보를 위해 크라우드 소싱(Crowd sourcing) 기법을 도입했다고 설명했다. 포인트를 제공해 일반 사용자들의 참여를 유도한 결과, 총 2만5000여명이 발화에 참여했으며 같은 예산으로 기존보다 최대 8배 많은 데이터를 수집할 수 있었다고 덧붙였다. 높은 정확도로 외부 감리 업체 측정 결과 99% 이상의 품질인증도 받은 상태다.

ETRI는 해외DB 가격 대비 5% 수준에서 제공할 예정이다. 보통 해외업체로부터 DB를 구입하는 경우, 언어 당 1~2억 원 정도의 비용이 소요된다. 향후 기존 배포 언어들의 정확도·데이터 품질 개선에 나서는 한편 영어, 중국어, 일본어 음성 데이터 구축도 추진할 방침이다.

ETRI 음성지능연구그룹 윤승 박사는 “이번에 공개되는 음성DB를 활용해 언어음성기술을 개발할 경우 해외 신규시장 진출 및 국가 경쟁력 강화에 큰 기여를 할 것으로 예상된다”고 설명했다.

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지