KT, GPT-4o 기반 ‘SOTA K’ 공개…“한국어·전문지식 이해력 성능 검증”

MS와 협업 결과물, KT “다수 벤치마크서 GPT-4o 능가”

2025-09-29 김소현 기자

KT 기술혁신부문 연구원들이 SOTA K를 테스트하고 있다. [사진=KT]

KT가 마이크로소프트와의 전략적 협업을 통해 개발한 GPT-4o 기반의 한국적 인공지능(AI) 모델(SOTA K built on GPT-4o)을 29일 정식 공개했다.

KT는 “기존 대규모언어모델(LLM)은 영어권 중심 데이터로 학습돼 한국어와 한국의 독특한 사회·문화적 맥락 반영에 한계가 있었다. 이를 해결하기 위해 고품질 한국 특화 데이터를 대규모로 확보하고, MS와의 협력을 통해 GPT-4o를 한국 사회에 최적화된 모델로 발전시켰다”고 설명했다.

SOTA K는 한국적 AI의 4대 핵심 철학인 ▲데이터 주권 보호 ▲한국 문화 이해 ▲모델 선택권 보장 ▲안전하고 책임감 있는 AI를 모두 구현한 모델이다.

한국어 경어법과 방언은 물론 법률·금융·역사 등 국내 특정 산업군 내에서 사용하는 전문 용어까지 자연스럽게 이해하고 생성할 수 있다는 게 KT의 설명이다.

KT는 “한국적 AI 지표를 새로 정의하고 이를 측정할 수 있는 자체 데이터셋을 구축해 정량 평가와 정성 평가를 진행한 결과 SOTA K는 한국어 이해, 생성, 추론, 사회·문화, 한국 전문지식 등 주요 지표에서 GPT-4o 대비 우위를 보였다”고 강조했다.

일례로 한국사, 한국어, 한국 법령 등 고난이도 한국적 지식을 요구하는 대한민국 공무원 시험과 귀화 시험에서 GPT-4o 모델을 능가하는 성과를 거뒀다.

실제 고객사례에서도 긍정적인 결과를 얻었다. 메리츠화재에서는 보험 업계에 특화된 약관의 자동 요약 리포트 생성과 상담원 스크립트 생성에서 SOTA K가 우수한 결과물을 보였고, EBS와의 협력에서는 초중고 난이도별 교과 문항을 생성해 맞춤형 학습을 제공하는 측면에서 SOTA K의 높은 활용 가능성이 확인됐다.

연세의료원에서는 영어와 한국어가 혼합된 의료 데이터를 환자가 쉽게 이해할 수 있도록 한국적인 표현으로 자연스럽게 안내하고 날짜 표기법 등의 세밀한 영역까지 한국인의 생활 방식과 문화를 깊이 이해하고 있음을 확인했다고 KT는 설명했다.

SOTA K는 특히 한국적 AI 평가 중 하나인 ‘책임감 있는 AI’ 항목에서 높은 평가를 받아 AI 응답 및 법률과 권리 준수, 사회·경제 영향도의 안전성, AI 모델의 강건성의 우수성을 입증했다.

KT는 SOTA K를 물리적으로 대한민국 내 존재하는 클라우드 리전에서 운영하며 자체 개발한 벡터 모델 기반 한국적 검색증강생성(RAG) 기술과 결합해 기업별 맞춤형 지식 기반을 구축할 수 있는 서비스 환경도 제공한다.

KT는 우선 자사 B2C 사업에 SOTA K를 적용해 자체 및 협업 모델 라인업을 검증한 뒤 파트너사에 서비스를 확대 제공할 방침이다.

KT Agentic AI Lab장 윤경아 상무는 “SOTA K는 글로벌 수준의 기술력과 한국적 AI 특화를 동시에 실현한 혁신적 모델로 MS와의 협업을 통해 축적한 기술적 노하우는 향후 KT의 다양한 AI 모델 개발에 확산 적용될 것”이라며, “국내 AI생태계 활성화는 물론 공공과 민간 전반에서 AI를 활용한 혁신을 주도하며 국가 경쟁력 제고에 기여할 것”이라고 밝혔다.