오픈소스 기계번역(Open Source MT) 기술 구현을 위한 핵심 도전과제 ③

최태우 / 기사승인 : 2019-07-22 08:40:26
  • -
  • +
  • 인쇄
[source=sdl]

신경망 기계번역(NMT) 모델을 고려하고 있다면, 단순하게 모델을 구축하는 것보다 정확한 설치를 수행하는 것이 무엇보다 중요하다. MT 개발에 있어 기업에게 요구되는 핵심 요구사항은 엔터프라이즈 환경에서 기계학습(ML) 연구와 기술개발에 대한 장기적인 경험이다.


유스케이스 또한 중요한 부분이다. 컴퓨팅 언어학, 데이터 관리, 사람과 번역기술 간 상호작용 및 솔루션 간 시스템 통합이 요구되는 부문이기 때문에 더 중요하다고 할 수 있다. 유스케이스 하나를 획득하는 데에는 수년의 시간이 소요된다. 광범위한 경험이 요구되면서 수천 개의 시스템 간의 성공적인 융합이 필요하다.


다년 간 SDL의 MT 연구팀은 데이터 기반 MT를 활용하면서 공공·민간영역에서의 엔터프라이즈 MT 개발에 참여해왔다. 이를 토대로 성공적인 엔터프라이즈 MT 구현을 위해 필요한 기술적인 요구사항을 정리해보면 아래와 같다.


- MT 엔진의 교육, MT 구축을 위한 데이터 준비
- 엔터프라이즈 컨텍스트 부문에서 요구되는 ML 기술
- 배포된 시스템에서 기존 기능을 유지-관리하는 툴과 아키텍처, 인프라 개발
- 미션크리티컬 환경에서도 적응할 수 있는 일관성
- 툴과 핵심 MT 알고리즘에 가치를 더하고, 시스템이 배포 단에서 수행할 수 있도록 지원하는 기능
- 새로운 알고리즘을 빠르게 통합-테스트할 수 있도록 지원하는 최적화 기술
- 번역가-언어학자와의 긴밀한 협력으로 현재 배포된 기술별, 언어별 문제를 해결하는 능력
- 번역 관리 소프트웨어 및 프로세스 간의 통합 능력
- 타 콘텐츠 관리 서비스, 통신 인프라 간 통합으로 MT를 안전하게 보급할 수 있는 인프라


사실 기업이 자체 관리하는, 오픈소스를 활용한 MT를 구축하는 프로젝트에는 장기적인 계획과 투자가 필수적으로 수반된다. 무엇보다도, ML은 물론 다양한 관련 분야에서 전문지식을 구축하는 데 필요한 투자가 중요하다.


이는 전자메일, 컨텐츠 관리 및 데이터베이스 시스템 선택과 관련된 전략을 설정할 때와 같은 조건에서 심도있게 고민해봐야 한다는 말로 정리할 수 있다.


기업이 추구하는, 제대로 된 MT를 구현하게 된다면 비즈니스를 글로벌 영역으로 확장할 수 있으며, 이 또한 중요한 시스템(툴)로써 주요 전략적 이니셔티브와 같은 조건에서 고려하고 선택해야 한다는 사실을 잊지 말아야 한다.



글 : 커티 바시(Kirti Vashee) / MT 기술 에반젤리스트 / SDL



[저작권자ⓒ IT비즈뉴스. 무단전재-재배포 금지]

  • 글자크기
  • +
  • -
  • 인쇄
뉴스댓글 >

주요기사

+

많이 본 기사

마켓인사이트

+

컴퓨팅인사이트

+

스마트카

+

PHOTO NEWS