통사론·의미론·화용론 등 전문가 레벨 평가서 최고 수준 점수
추론모델 향후 오픈소스로 배포 예정
네이버가 30일 추론 능력을 강화한 생성AI ‘하이퍼클로바X 씽크(HyperCLOVA X THINK)’ 개발을 완료했다고 밝혔다. 네이버는 이날 모델의 설계와 성능 등 세부 정보를 소개하는 테크니컬 리포트도 공개하며 오픈소스로 공개할 계획도 전했다.
추론모델은 사용자가 질의를 입력하면 모델이 혼잣말하듯이 길게 생각하며 답변 계획을 수립하는 것이 특징이다.
이 과정에서 복잡한 문제를 작은 단위로 나누는 능력과 적절한 도구나 함수를 선택하는 능력, 실수를 반추하고 교정하는 능력이 발현되며 생성 정보의 정확도와 유용성이 향상돼 AI에이전트 서비스의 핵심적인 기술로도 주목받고 있다.
네이버는 “하이퍼클로바X 씽크는 추론 능력을 기반으로 언어에 대한 이해를 한층 높은 수준으로 끌어올렸다”고 강조했다.
네이버에 따르면, ‘KoBALT-700’ 벤치마크로 주요 대규모언어모델(LLM)의 언어 능력을 측정한 결과 하이퍼클로바X 씽크는 유사 규모로 구축된 국내 주요 추론모델 및 글로벌 최고 수준 오픈소스 모델보다 더 높은 점수를 기록했다.
이 벤치마크는 서울대학교 언어학과에서 LLM의 깊이 있는 한국어 이해도를 진단하기 위해 설계됐으며 AI가 대화의 격률을 적절하게 파악하는 여부와 문장의 논항 구조를 정확히 분석하는지 등을 평가하는 전문가 수준의 문항들로 구성돼 있다.
또 다른 한국어 성능 평가 지표인 ‘HAERAE-Bench’에서도 추론모델을 포함한 국내외 주요 오픈소스 모델보다 높은 점수를 기록했다고 네이버는 설명했다.
네이버는 하이퍼클로바X 씽크를 통해 AI가 언어뿐만 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술도 확보했다고 전했다.
네이버가 이날 공개한 테크니컬 리포트에 따르면, 하이퍼클로바X 씽크는 ‘STEM(Science/Technology/Engineering/Mathematics)’ 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 통해 정답을 맞히는 모습을 보였다.
가령 한국 대학수학능력시험 생명과학 문제에서 그림으로 제시된 ‘생태계 천이 과정’과 ‘특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프’를 인식·분석하고 이를 양수림·혼합림·지의류 등에 대한 지식과 결합해 선택지 중 올바른 서술을 골라내는 형태다.
네이버클라우드 유강민 리더는 “이번 추론 모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다”며 “이미 하이퍼클로바X 기반의 이미지와 영상, 음성 멀티모달 기술을 확보하고 있어 향후 보다 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화할 계획”이라고 말했다.
네이버는 추론모델을 오픈소스로도 공개할 계획이다. 경쟁력 있는 한국어 추론모델을 바탕으로 한국 AI기술 생태계가 활성화될 것으로 기대된다. 네이버가 앞서 4월 공개한 오픈소스 경량모델(HyperCLOVA X SEED)는 한 달여 만에 50만 다운로드를 넘어선 바 있다.
성낙호 네이버클라우드 하이퍼스케일 AI기술 총괄은 “하이퍼클로바X 씽크를 통해 지능 측면에서 상당한 발전이 이뤄졌다”며 “급변하는 AI 흐름 속에서 글로벌 선두권 그룹의 기술을 지속적으로 갖춰가고 있으며 기술 패러다임에 발맞추는 것에 그치지 않고 사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것”이라고 말했다.
관련기사
- 엔씨AI, 샌드박스네트워크와 협업…“크리에이터 글로벌화 돕는다”
- GCP, 오픈소스 AI에이전트 ‘제미나이 CLI’ 공개
- 네이버페이 박상진 “글로벌 탑티어 핀테크 플랫폼으로 도약”
- 대다수 에이전틱AI는 PoC 단계…“프로젝트 40%는 좌초될 수도”
- 카카오엔터, AMD와 개발자 밋업…AI인프라 성능 고도화 협력
- S2W, 경량형 생성AI 플랫폼 ‘SAIP 라이트’ 출시
- 디노티시아, 원스테크넷과 공공·민간 AI 보안 시장 ‘정조준’
- [데스크칼럼] 네이버가 주목한 중동…글로벌 진출 돌파구 될까
- 데이터브릭스, GCP와 파트너십…‘데이터 인텔리전스-제미나이 통합’
- 카카오, 언어모델 ‘카나나’ 4종 오픈소스로 공개