오픈소스 시장 본격 진출, 글로벌 협업 확대

(왼쪽부터) 한컴 김연수 대표, 듀얼랩 보리스 두브로브 대표가 협약 체결 후 기념촬영을 하고 있다. [사진=한컴그룹]
(왼쪽부터) 한컴 김연수 대표, 듀얼랩 보리스 두브로브 대표가 협약 체결 후 기념촬영을 하고 있다. [사진=한컴그룹]

한글과컴퓨터가 오픈소스 전문기업 ‘듀얼랩(Duallab)’과 손잡고 오픈소스 시장에 본격적으로 진출한다. 

한컴은 듀얼랩과 ‘오픈 PDF 데이터 로더(Open PDF Data Loader)’의 공동 개발과 사업 협력을 골자로 하는 양해각서를 체결하고 협력에 나선다고 9일 밝혔다.

최근 허깅페이스에 등록된 인공지능(AI) 모델 수가 100만건을 돌파하며 오픈소스 기반 AI 생태계가 빠르게 확장되고 있다. 오픈소스가 단순한 코드 공개를 넘어 신뢰·협업·포용이라는 가치를 중심으로 AI 산업 전반의 패러다임 변화를 견인하고 있다.

한컴은 “PDF 데이터 추출 기술을 오픈소스로 공개함으로써 글로벌 오픈소스 생태계에 기여하고, 동시에 기술 경쟁력도 강화할 계획”이라고 설명했다.

양사가 공동 개발하는 오픈 PDF 데이터 로더는 PDF 문서에서 데이터를 빠르고 정밀하게 추출할 수 있도록 지원하는 소프트웨어개발키트(SDK)다. 

이번 협력의 파트너인 듀얼랩은 PDF 기술 표준을 관장하는 ‘PDF 협회(PDF Association)’의 정회원으로 세계적으로 인정받는 PDF/A 유효성 검사 도구인 ‘베라PF(veraPDF)’의 오픈소스 기술 개발을 주도해 왔다. 

한컴은 듀얼랩이 보유한 풍부한 오픈소스 개발 경험과 글로벌 네트워크를 활용해 프로젝트의 안정적인 시장 안착을 도모하고, 오픈소스 생태계 내에서 주도권을 확보해 나가겠다는 복안이다.

한컴은 이미 AI 기반 데이터 추출 기술 분야에서 가시적인 성과를 거두고 있다. 대표 제품인 ‘한컴 데이터 로더’는 기업이 외부로의 데이터 유출 우려 없이 자체 보유한 문서를 활용해 거대언어모델(LLM)을 학습시킬 수 있도록 지원하는 설루션이다. 

이 제품은 PDF를 비롯해 HWPX, 워드, 파워포인트 등 다양한 형식의 문서에서 텍스트는 물론, 표와 이미지 같은 객체까지 정확하게 추출함으로써 검색증강생성(RAG) 기술의 효율성을 극대화한다. 

이번 오픈 PDF 데이터 로더 개발은 듀얼랩의 PDF 데이터 추출 기술과 한컴의 AI기술을 결합해 PDF 문서에 특화된 오픈소스 버전을 선보이고 글로벌 시장 저변을 확대하는 것을 목표로 추진된다.

한컴은 오픈소스의 공유 가치를 실현하면서도 지속가능한 사업 모델을 구축을 목표로 핵심적인 PDF 데이터 추출 SDK를 누구나 자유롭게 사용할 수 있도록 공개하고 광학문자인식(OCR)의 정밀도를 높이거나 표, 수식, 차트 등을 고도화된 AI기술로 인식하는 기능은 별도의 상용 애드온(Add-on) 형태로 출시해 수익을 창출할 계획이다. 

김연수 한컴 대표는 “듀얼랩과의 협력은 한컴이 축적해 온 문서 기술력과 최신 AI, 오픈소스 트렌드를 결합해 글로벌 시장에 본격 진출하는 중요한 전환점”이라며 “개방과 협력의 가치를 바탕으로 전세계 개발자들과 함께 성장하는 기술 생태계를 구축하고 이를 통해 한컴이 글로벌 AI 서비스 기업으로 도약하는 기반을 마련하겠다”고 말했다.

관련기사

저작권자 © ITBizNews 무단전재 및 재배포 금지