[source=pixabay]

생명과학업계에서 기계번역(Machine Translation, MT)의 새로운 사용과 수용에 대해 알아보고자 합니다. MT가 향후 업계에 제공하는 확장 가능한 역할을 살펴보고 몇 가지의 주요 사용 사례와 응용 프로그램을 소개하고자 합니다.

생명과학산업은 오늘날 다른 모든 산업과 마찬가지로 점점 다양해지는 콘텐츠의 영향으로 업계에서 MT와 기계학습(Machine Learning, ML)의 사용이 점차 증가하고 있습니다. 이러한 급증 요인으로는 ▲약물 개발에 영향을 미치는 다언어 연구의 양 ▲신약 개발·질병 확인·전세계적 임상 연구 및 전염병 모니터링에 영향을 미치는 다국어 외부 소비자 데이터의 증가 등을 들 수 있습니다.

소비자는 다양한 디지털 플랫폼에서 다양한 방법으로 정보를 공유하게 됩니다. 이러한 플랫폼을 모니터링하여 제품과 관련된 트랜드를 파악하는 것은 현재 무엇보다도 중요해진 상태입니다.

MT 사용의 급증은 무엇을 말하는가?
오늘날 번역이 필요한 컨텐츠는 다양하고, 연속적이며, 실시간 내용을 담고 있습니다. 또한 이러한 컨텐츠의 사용은 앞으로도 급증할 것으로 예상됩니다.

글로벌 공용 MT포털의 사용양은 하루 8천억 단어로 추정됩니다. 대다수의 글로벌 기업 내 직원들이 이미 공용 MT를 사용하고 있습니다. 하지만 즉각적이고 항상 사용 가능한 번역 서비스의 이점은 있을 수 있으나, 데이터 보안의 위험은 간과하기 쉬운 현실입니다.

간혹 일부의 대형 글로벌 기업은 이러한 통제되지 않은 공용 MT의 사용으로 인해 데이터 보안과 디지털 인프라에서 제어되고 통합된 MT에 대한 광범위한 필요성을 인식하고 있습니다.

그간 생명과학산업계에서 MT를 사용하지 않았던 이유
생명과학 분야에서는 그 동안 품질 요구 사항, 기술 채택 지연, 글로벌 기준·최적화 등의 이유로 MT를 사용하지 않았습니다. 이와 함께 또 다양한 이유도 존재합니다.

- 생명과학산업은 높은 품질, 정확한 번역이 필요했다.
- 생명과학산업은 일반적으로 신기술을 도입함에 있어서 얼리어댑터가 아니다.
- 생명과학산업에서의 리스크 관리, 완화에 대한 우려가 존재했다.

위의 항목을 살펴본 것과 같이, 여러 이유로 생명과학 분야에서는 MT 도입은 늦어질 수밖에 없었습니다.

하지만, 생명과학업계에서는 내부과학데이터(특히 유전체학 및 프로테오믹스 데이터)의 기하 급수적인 증가로 글로벌 연구가 시작되었으며, 이 연구는 마약을 개발하는 새로운 방법, 질병 경로·증상에 대한 지식, 개인 환자를 위한 맞춤 치료법 개발과 같은 다양한 분야로 확장되어 왔습니다.

또 이러한 다양한 획기적인 연구를 현지 언어로 연구하고 진행할 수 있는 것은 경쟁력을 위한 필수 요건으로 현재 자리를 잡았습니다.

급격히 증가하는 데이터를 사람이 모두 처리할 수는 없다.

중앙연구소, 처방전, 클레임, EHR 및 HIE(Health Information Exchanges)의 데이터와 같은 환자 관련의 데이터는 현재 엄청나게 증가하고 있으며, 향후 아래와 같은 분석적이고 통찰력 있는 기회가 열릴 것으로 예상됩니다.

- 약물 발견: 약물, 질병 경로 및 바이오 마켓에 대한 징후를 분석·발견할 수 있다.
- 임상 시험: 조사자와 현장을 보다 잘 선택하고 나은 기준을 정의하여 임상 시험을 최적화할 수 있다.
- 웨어러블: 주요 매개 변수 추적 및 치료 준수와 같이 환자를 모니터링하기 위해 상당한 양의 데이터를 생성하게 되고 관리가 필요한 상황이다.
- 집계된 데이터: 여러소스의 데이터를 집계하는 기능은 데이터의 양과 사용을 증가시킨다.

소셜미디어(SNS)의 영향
체내에서의 문제가 발생되거나 부작용과 관련된 신호는 어디에서나 볼 수 있습니다. 이러한 데이터를 모니터링하고 이해할 필요성은 오늘날 정보가 전세계로 퍼져나갈 수 있어 중요하게 다뤄져야 합니다. 안전문제는 환자의 건강과 회사의 재정이나 인지도에 심각한 문제를 끼칠 수도 있기 때문입니다.

기업이 MT를 사용하는 중요한 영역으로는 소셜미디어와 마케팅 영역입니다. 생명과학 조직은 MT기술을 활용해 여러 언어로 대량의 데이터를 컴파일할 수 있습니다.

모든 언어 조직에서 감정을 모니터링하면 생명과학 조직이 시장 별 문제와 정서, 추세를 추적할 수 있습니다. 또 고객의 불만을 처리하고, 위기를 피할 수 있으며, 긍정적인 이미지를 구축하기 위해 마케팅과 의사소통 전략을 개발하는 데 도움이 될 수 있습니다.

MT를 활용한 전염병 발생 예측
ML과 AI는 위성데이터, 웹(Web)의 히스토리 정보, 실시간 소셜미디어의 업데이트와 기타 리소스를 기반으로 전세계의 유행성질병 발생을 모니터링하거나 예측하는 데에도 적용되고 있습니다. 예를 들어, 말라리아의 발생 예측은 온도와 평균 강우량, 기타 데이터 포인트를 고려해 제공되고 있습니다.

점차 이를 구축하기 위한 집계된 데이터에서 요구되는 조건으로는 다국어이고, 불륨이 크며, 신속한 대응을 요구하기 때문에 MT가 긍정적인 요소로 활용될 수 있습니다. 사실 이러한 모니터링은 MT기술이 없이는 불가능하기 때문입니다.

글 : 커티 바시(Kirti Vashee) / 언어기술 에반젤리스트 / SDL

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지