알리바바그룹의 인공지능(AI) 알고리즘이 글로벌 VQA 챌린지에서 1위를 차지했다. VQA는 주어진 이미지를 이해하고 관련 텍스트 질문에 답을 하는 평가다.
알리바바는 이미지 관련 문답에서 자사의 알고리즘은 81.26%의 정확도를 달성, 인간의 80.83%를 능가했다고 설명했다.
VQA 챌린지는 글로벌 컴퓨터 비전 학회(CVPR)가 2015년부터 개최하는 행사로, 페이스북, 마이크로소프트(MS), 스탠포드대학교 등 유수의 기업과 대학이 참가한다.
이미지와 관련 자연어 질문이 제시되면 각 모델이 자연어로 정답을 제시해 평가한다. 올해 챌린지는 25만여 개의 이미지와 110만개 질문으로 구성되었다.
이번 챌린지에 적용된 알고리즘은 알리바바그룹의 글로벌 연구기관인 다모아카데미가 개발했다. 다양한 시각적 표현, 사전 학습된 멀티모달 언어모델, 적응적 크로스 모달 시멘틱 융합·연결 등의 기술을 활용하여 이미지 분석은 물론 질문 의도를 이해하고 추론을 통해 대화하듯 답을 할 수 있도록 했다.
현재 VQA 기술은 알리바바그룹의 사업 전반에 걸쳐 널리 적용되고 있다. 이커머스 플랫폼에서 수만 명의 판매자가 활용하고 있는 지능형 챗봇 알리미가 대표적인 예로, 이외에 VQA 기술은 광범위하게 활용 가능해, 이커머스 사이트 검색 기능, 의료 영상 분석 기능, 스마트 주행 등에도 적용된다.
스 루오 다모아카데미 자연어처리(NLP) 책임자는 “머신 인텔리전스 부문에서 의미 있는 결과를 내며 알리바바그룹의 꾸준한 R&D 성과를 보여주게 되어 자랑스럽다. 이는 언젠가 로봇이 인간을 대체할 것이라는 의미가 아니다. 지능화된 기계가 일상적인 업무와 생활을 보조하여 사람들은 자신이 가장 잘하는 창의적인 일에 집중할 수 있게 될 것”이라고 밝혔다.
한편, 알리바바그룹의 머신러닝(ML) 모델은 대표적인 NLP 모델 성능 벤치마크인 GLUE 순위에서도 1위를 기록한 바 있다.
2019년에는 AI 분야에서 가장 까다로운 독해 테스트로 꼽히는 MS 기계독해 데이터세트 테스트에서 인간보다 더 높은 점수를 득점했으며, MS 매크로 문답 태스크에서 0.54점을 기록하면서 MS가 제시한 벤치마크(0.539점)에 앞섰다.
관련기사
- AI21랩스, 서비스형 NLP(NLPaaS) 오픈베타 개시
- AI역량에 집중하는 카카오엔터, “인재 확보·육성에 집중”
- 네이버, 글로벌 AI학회서 논문 51건 채택…‘초대규모 AI 연구에 집중’
- 순차 입력 정보를 처리하는 심층신경망(DNN) 구조…어떻게 작용할까?
- 인공지능(AI/ML)이 자연어처리 과정에서 문장의 품사를 알아내는 방법 ②
- 오타도 알아서 수정·검색…네이버, ‘초거대 AI언어모델’ 검색 서비스에 반영
- 인공지능(AI/ML)이 자연어처리 과정에서 문장의 품사를 알아내는 방법 ①
- 네이버, 초대규모 AI 하이퍼클로바 연구논문 ‘EMNLP 2021’서 공개
- 카카오엔터, 세종시·제주도와 ‘카카오i 커넥트 톡’ 계약 체결
- 티맥스에이아이·세오, 로봇 및 AI 신사업 개발 협력…MOU 체결