상단여백
HOME 컴퓨팅인사이트 테크니컬리포트
오픈소스 기계번역(Open Source MT) 기술 구현을 위한 핵심 도전과제 ②

지난 몇 년 간, 개발자들은 ‘최고의 NMT(신경망 기계번역) 알고리즘’을 개발하기 위해 노력해왔다. 기업 규모에 따라 배치되는 엔터프라이즈급 기계번역(MT) 시스템은 장기적인 관점에서 보았을 때, ‘모든(all-in)’ 것을 해결하기 위한 대안으로만 생각한다면 프로젝트가 실패할 확률도 있다.

기업의 입장에서는 기존 시스템을 업그레이드하고 또 새로 고치는 엔지니어링 팀을 운영하는 데에는 지속적인, 장기적 관점에서의 투자다. 또 오픈소스 커뮤니티에서 이뤄지고 있는 기술적인 진화를 따라잡기 위해서 추진되어야 하는 실험, 시험을 대부분의 실무자들이 병행하기 어려운 현실이기도 하다.

모세(Moses)와 같은 오픈소스 이니셔티브도 어려움에 직면해 있는 상태다. 초기 툴킷 개발에 관여한 핵심 인력(학생)들은 졸업하면서 기업에 입사하게 되면 기술은 정체되기 때문이다. 핵심 연구진들은 더 많은 학문적인 위상과 잠재력을 가진 다른 연구부문으로 옮겨갈 수도 있다.

이러한 전환은 DIY(do-it-yourself) MT 실무자들이 시간과 중복적인 자원 부문에서 큰 비용을 들여 툴킷을 교체해야만 하는 상황에 직면할 수도 있음을 보여주는 사례다.

엔터프라이즈용 MT 역량을 강화하기 위해, 또 기본적인 오픈소스 MT 툴킷의 문제를 더 잘 이해햐기 위해 대다수의 조직들이 워드프레스(WordPress)와 같은 툴 대신 콘텐츠관리시스템(CMS)을 사용하는 이유를 생각해보자. 

두 시스템 모두 조직 내 웹 구축과 이를 돕는 데 유용한 기능을 제공하고 있으나, CMS 시스템은 기업이 비즈니스 운영에 있어 사용할 수 있는 다양하고 전문화된 기능을 제공하기 때문이다.

대다수의 기업들은 비즈니스 경쟁력 확보를 목적으로 추진하고 있는 디지털혁신(DT) 프로젝트 부문에서, 글로벌 네트워크와 협업, 콘텐츠 공유의 필요성에 대한 인식을 갖고 있으며, 이들 중 다수는 MT가 이제 더 나은 디지털경험(DX)을 지원하는 중요한 기술 구성요소로 인식하고 있다.

하지만 MT 시스템에는 데이터의 보안과 기밀성, 다양한 비즈니스 사용 사례에 대한 분석이 필요하다. 또 광범위한 엔터프라이즈 시스템에서 활용할 수 있는 다수의 시나리오를 구축해야 하며, 또 이를 위한 전문인력도 필요하다.

최적화 문제도 이러한 핵심기술을 선택하는 데 있어 중요한 요소가 되고 있다. MT는 점점 더 기업이 추구하는 글로벌 비즈니스 부문에서의 핵심기술(mission-critical technology)로 자리하면서, 엔터프라이즈용 CMS, 이메일·데이터베이스 시스템을 선택하는 것만큼 선택에 앞서 전문적인 요구사항을 심도있게 고려해야만 하는 분야다.

 

글 : 커티 바시(Kirti Vashee) / MT 기술 에반젤리스트 / SDL

 

최태우 기자  taewoo@itbiznews.com

<저작권자 © IT비즈뉴스-아이티비즈뉴스, 무단 전재 및 재배포 금지>

최태우 기자의 다른기사 보기
icon인기기사
Back to Top