구글 딥마인드 ‘허사비스’ 주도로 개발, 기본 모델 바드에 통합 완료

데미스 허사비스 구글 딥마인드 CEO [source=google]
데미스 허사비스 구글 딥마인드 CEO [source=google]

구글이 6일(미국시간) 대규모언어모델(LLM) ‘제미나이(Gemini)’를 정식 공개했다. 구글은 이날 공개한 제미나이가 오픈AI의 최신 모델인 GPT-4보다 높은 성능을 제공한다고 밝혔다.

구글이 공개한 제원에 따르면, 제미나이는 이미지와 음성 모두 인식하면서 코딩도 할 수 있는 능력을 갖춘 ‘멀티모달AI’로 구현됐다. 멀티모달은 시각·청각 등을 활용해 텍스트는 물론 이미지·음성·영상 등을 통해 상호작용하는 것을 말한다.

구글은 “제미나이가 수학 문제를 풀거나 데이터를 분석하는 등의 높은 추론 능력도 갖췄다”고 소개했다.

구글은 앞서 지난 4월 AI 조직인 구글브레인과 딥마인드를 ‘구글 딥마인드’로 통합하고 제미나이를 개발해왔다. 2016년 첫 번째 AI 이슈를 견인한 바둑 두는 AI ‘알파고’의 아버지로 유명한 데미스 허사비스가 이 프로젝트를 주도하고 있다.

제미나이는 머신러닝(ML) 규모에 따라 울트라(Ultra)와 프로(Pro), 나노(Nano) 등 3개 모델로 출시된다.

범용으로 쓰이는 제미나이 프로는 이날부터 구글의 AI챗봇 서비스 ‘바드’에 탑재된다. 바드에는 지금까지 PaLM2가 적용됐다. 이번 업데이트로 미국을 포함 170여개국에서 우선 출시된다.

고성능인 제미나이 울트라는 현재 외부에서 테스트 중이며 내년 초 ‘바드 어드밴스트(가칭)’의 이름으로 바드에 통합될 예정이다. 

구글은 제미나이 울트라의 가장 강력한 기능으로 고급 추론 기능을 꼽으며 “기존 AI 모델이 보여주지 못한 작업을 수행할 수 있는 새로운 능력을 보여줄 것”이라고 강조했다.

허사비스 구글 딥마인드 CEO는 “울트라 모델이 레드팀 테스트(보안·안전성 평가)를 거칠 것이며, 구글은 이 결과를 미국정부와 공유할 것”이라고 설명했다.

앞서 바이든 행정부는 지난 10월 ‘인공지능(AI) 지침’ 행정명령에 서명한 바 있다. 이 행정명령에는 테크기업이 AI 시스템에 대한 테스트 결과를 외부에 공개하기 전에 미국정부와 공유해야 한다는 내용이 담겼다.

제미나이 나노는 인터넷 연결 없이도 구현이 가능한 온디바이스 형태로 접목된다. 구글이 지난 10월 공개한 최신 스마트폰 ‘픽셀8 프로’에 탑재된다.

다만, 생성AI가 허구를 진실처럼 답하는 ‘환각현상(Hallucination)’과 오답 제시 가능성 또한 관련 업계에서 해결해야 할 문제라고 언급했다. 엘리 콜린스 구글 딥마인드 제품책임자는 “이는 여전히 해결되지 않은 연구문제”라고 진단했다.

[사진=AFP통신]
[사진=AFP통신]

◆MMLU 90% 정답률…GPT-4 능가
구글은 “제미나이 울트라의 경우 대규모다중작업언어이해(MMLU)에서 90%의 정답률을 기록했다”고 설명했다. MMLU는 수학·물리학·법률·윤리 등 50여개 주제를 복합적으로 활용해 지식과 문제해결 능력을 평가하는 테스트다. 

구글 설명에 따르면 제미나이는 인간 전문가(89.8%)를 능가하는 최초의 AI모델이다. 오픈AI의 GPT-4는 이 테스트에서 86.4%를 기록한 바 있다.

구글은 “제미나이가 현재 가장 우수한 모델과 비교해 32개 지표 중 30개에서 앞섰다”며 “가장 우수하다고 평가되는 GPT-4보다 뛰어나다”고 강조했다.

순다르 피차이 구글 CEO는 “첫 번째 버전인 제미나이 1.0은 구글 딥마인드의 비전을 처음으로 실현했다”며 “구글이 기업으로 수행한 가장 큰 과학적 엔지니어링 성과”라고 소개했다.

관련기사

저작권자 © IT비즈뉴스(ITBizNews) 무단전재 및 재배포 금지