NIA 보고서, 데이터 유출 방지 효과와 대규모 컴퓨팅 자원 확보 용이

[사진=AFP통신]
[사진=AFP통신]

챗GPT(Chat GPT) 열풍으로 대규모언어모델(LLM) 기반의 초거대AI에 대한 관심이 늘어난 가운데, 정부·민간의 협업을 바탕으로 한 국가 플랫폼 기반의 초거대AI 도입 방향을 연구할 필요가 있다는 조언이 나왔다.

한국지능정보사회진흥원(NIA)는 18일 ‘공공분야 초거대 AI 민간 플랫폼 활용 방향 보고서’를 통해 “다양한 보안 이슈, 정부의 민감데이터 유출을 방지하기 위해 학습용 데이터와 사용자 질의는 폐쇄형 정부 전용 클라우드에서만 접근할 수 있어야 한다”면서 이같이 밝혔다.

초거대AI 도입을 위한 기술적 난이도는 구축 환경에 따라 달라질 수 있어 정부 주도의 민관 협력 초거대AI 플랫폼 구축이 필요하다는 설명이다.

보고서는 “정부가 민간의 GPU 운영 능력을 따라잡기 곤란한 점이 있어 민간기업에 GPU 클라우드 운영을 위탁하는 구조가 필요하다”고 제언했다. 또 정부는 거대한 GPU 자원을 지속해서 확보하기 위한 방안을 마련해야 한다고 조언했다.

보고서는 “만약 민간에서 초거대AI 모델을 운영하게 되면 모든 기준이 공익성보다는 영리 추구를 우선할 수밖에 없다, 또 서비스의 품질 저하도 발생할 수 있다”고 지적했다.

대국민 서비스와 관련한 초거대AI에 대한 지속적인 투자·개발·업그레이드에 소홀해질 수 있다는 것이다.

또 특정 민간업체가 초거대AI 모델을 독점으로 운영한 뒤 비용을 청구할 경우, 이 비용이 합리적인 가격인지 판단하기 어렵고 또 지속적인 운영비용 증가에 대응하기도 어렵다고 짚었다.

국가 초거대AI 플랫폼 구성(안) [NIA 보고서인용]
국가 초거대AI 플랫폼 구성(안) [NIA 보고서인용]

보고서는 “국가 기반 폐쇄망에 민간의 검증된 LLM 모델을 활용하려면 이 모델의 사전학습 데이터를 구매해 처음부터 학습하는 방법, 완성된 민간 기본 모델을 구매해 국가 폐쇄망 기반 정부 플랫폼에서 운영하는 방안 등을 고려할 수 있다”고 설명했다.

서비스 비용의 경우 “학습에 사용되는 GPU와 추론에 사용되는 GPU를 효율적으로 사용할 것인가에 대한 GPU 사용 스케쥴링의 최적화가 필요”하며 “구체적인 계획에 따라 요청 당 발생하는 비용을 최적화할 수 있는 구체적인 방안과 LLM옵스(LLM-Ops)를 도입하는 방안도 고려해볼 사항”이라고 분석했다.

또 민간의 검증된 LLM을 활용하기 위해 API 서비스 활용 시에는 게이트 서버에 보안 기능을 적용하면 내부 데이터의 외부 반출에 따른 보안 문제를 해소할 수 있다고 제시했다.

보고서는 “명확한 계획이 수립되면 대규모 컴퓨팅 자원을 확보할 수 있으며 정부 주도하에 상대적으로 용이하게 초거대AI 모델 구축이 가능하다”고 전망했다.

관련기사

저작권자 © ITBizNews 무단전재 및 재배포 금지