네이버랩스가 연구해 온 ‘공간지능(Spatial Intelligence)’ 기술이 ‘2024 유럽컴퓨터비전학회(ECCV)’의 두 부문에서 1위를 차지하며 기술 경쟁력을 증명했다. ECCV는 이미지 및 영상 등 컴퓨터 비전 분야에 특화된 최신 AI 연구성과를 발표하고 새로운 기술 화두를 제시하는 세계 최고 권위의 학회다.
네이버랩스는 이번 ECCV 2024에서 ▲Map-free visual re-localization ▲BOP 챌린지 두 부문에 모두 1위를 차지했다.
‘Map-free visual re-localization’ 챌린지는 정밀지도 등이 없는 상황에서도 얼마나 정확하게 측위가 가능한지를 겨룬다. visual localization은 일반적으로는 사전에 생성된 3D/HD 지도를 기반으로 측위(Localization)을 수행하는 과정을 거친다.
그러나 재난, 공사 현장 등 지도를 생성하거나 미리 준비할 수 없는 상황도 있어 지도 없이 측위하는 기술도 중요성이 높아지고 있다.
네이버랩스는 이 챌린지에 이미지를 3D로 재구성하는 AI기술 도구 ‘마스터(MASt3R)’를 선보였다. MASt3R는 정밀지도가 없는 상황에서도 충분히 정확한 측위가 가능하다는 점을 인정받아 구글·애플·메타 등 12개 참가팀 중 1위를 차지했다.
MASt3R는 네이버랩스유럽이 개발한 3D 비전 파운데이션 모델(VFM) ‘크로코(CroCo)’를 기반으로 만든 ‘더스터(DUSt3R)’의 업그레이드 버전이다.
네이버랩스는 BOP(Benchmark for 6D Object Pose Estimation) 챌린지에서도 1위를 차지했다.
이미지 내에 있는 물체들의 3차원 회전과 위치를 얼마나 정확히 추정하는지 겨루는 이 챌린지에서 네이버랩스의 기술 모델은 RGB이미지만으로도 물체의 위치를 가장 정확하게 측위(The Best RGB-Only Method)하고 가장 빠르게 처리(The Best Fast Method)할 수 있다는 평가를 받으며 1위를 차지했다. 이 모델 역시 3D 비전 파운데이션 모델 CroCo를 기반으로 제작됐다.
석상옥 네이버랩스 대표는 “공간지능은 네이버랩스 출범 이후 로봇과 자율주행 기술을 발전시켜 오며 꾸준히 준비해 온 분야이자 핵심 경쟁력 자체”라고 말했다.
이어 “로봇, 자율주행, 디지털트윈은 물론 이를 지원하는 클라우드 인프라, 1784와 같은 핵심 테스트베드, 나아가 중동 등 새로운 글로벌 이정표로도 확장할 수 있도록 R&D에 매진하겠다”고 말했다.
네이버는 경쟁력 있는 비전AI 기술을 바탕으로 생성AI 서비스를 고도화하는 데에도 속도를 낼 예정이다. 지난 8월에는 자체 초대규모 생성AI ‘하이퍼클로바X’ 기반의 시각 정보 처리 기술을 공개하고 이를 대화형 AI서비스 ‘클로바X’에 탑재했다.
네이버에 따르면 ChartQA, DocVQA, MathVista, MMMU 등 8개 벤치마크를 기준으로 하이퍼클로바X의 이미지 이해 능력은 글로벌 최고 수준 모델의 99.94%에 이른다.
관련기사
- 팀네이버, 사우디와 AI·로보틱스 분야 협력…중동시장 공략 강화
- LG전자 ‘SDC 2024’ 성료…비전AI 범용모델 등 SW 연구성과 공유
- 네이버, 테크 컨버전스 빌딩 확대 ‘스타트’…공간 플랫폼 확장 본격화
- SKT, 텔코 엣지AI 기반 자율주행 로봇 실증 완료
- 네이버, 사우디 정부와 DW 프로젝트 본격 착수
- SKT·경기도, AI 행동분석 기술 활용 협력 ‘맞손’
- 하이퍼커넥트, ICCV에서 액티브 러닝 기술 관련 논문 발표
- 네이버, 8년 연속 동반성장지수 ‘최우수’ 평가
- 소문난 잔치에 먹을 것 없다더니…‘로보택시’ 공개한 테슬라 주가 폭락
- 네이버, 자연어처리 학회 ‘EMNLP 2024’서 연구논문 4건 채택