상단여백
HOME 컴퓨팅인사이트 테크니컬리포트 포토
물리학과 딥러닝이 적용된 미래형 피킹 로봇(Picking Robot) 기술 ③

지난 글에 이어 이번 글에서는 토싱봇의 구조에 미치는 외부영향과 한계점, 또 향후 도전과제에 대해 알아본다.

토싱봇의 학습 내용을 살펴보기 위해 바구니에 다양한 사물을 넣고 이미지를 촬영하여 토싱봇의 훈련된 신경망에 입력한 후, 중간 단계의 픽셀 단위 심층 특징을 추출했다. 유사성을 기준으로 이와 같은 특징을 클러스터화하고 가장 근접한 인접 픽셀을 히트맵으로 시각화함으로써 화면에 나타난 모든 탁구공의 위치를 특정할 수 있다.

오렌지색 블록이 탁구공과 색이 유사함에도 불구하고, 토싱봇이 구분하기에 충분한 특징 차이가 존재한다. 마찬가지로 크기와 모양은 비슷하지만 색깔은 다른 모든 마커펜들의 위치를 특정할 수 있다. 

관찰결과에 따르면, 토싱봇은 쥐기와 던지기를 학습하는 데 있어 형태와 같은 기하학적인 특징에 더 많이 의지하는 것으로 보인다. 학습된 특징이 2차적 속성(물리적 특성)을 반영할 가능성도 있는데, 이러한 속성은 사물을 어떻게 던져야 하는지에 영향을 미칠 수 있다.

토싱봇은 명시적 감독 없이 사물을 분류할 수 있도록 심층 특징을 학습한다.

이러한 특징은 쥐기와 던지기라는 과업 수준의 지도를 제외하면 어떤 명시적 지도도 없이 처음부터 암묵적으로 학습되었다. 하지만 토싱봇 시스템이 여러 사물의 범주를 충분히 구분할 수 있게 만들기에 충분하다. 이번 실험은 ‘로봇이 시각적 세계의 의미체계(semantics)를 어떻게 학습해야 하는가?’라는 기계적 시각 분야에 시사하는 바가 크다고 할 수 있다.

고전적인 컴퓨터 시각의 관점에서, 의미체계는 인간이 구성한 이미지 데이터 세트와 수작업으로 구성한 분류 범주를 활용하여 사전 정의하는 경우가 많다. 하지만 이번 실험은 수행 과제와 관계가 있는 한도 내에서 물리적 상호작용만으로 사물 수준의 의미체계를 암묵적으로 학습하는 것이 가능하다는 것을 시사한다. 

이러한 상호작용이 더 복잡해질수록 의미체계의 분류 정도는 더욱 세분화된다. 더욱 높은 수준의 일반 지능을 지닌 로봇을 실현하기 위해서는 인간 개입이 전혀 없이 상호작용을 통해 로봇이 로봇 나름의 의미체계를 스스로 구축하도록 하는 것으로 충분할지도 모른다.

앤디 정(Andy Zeng) 구글 로보틱스 학생연구원

한계점과 향후 도전과제
토싱봇의 성과는 고무적이지만 나름의 한계도 존재한다. 예를 들어 토싱봇은 사물이 던져진 후 떨어질 때 충격을 견뎌낼 만큼 단단하다고 가정하고 있다. 

앞으로 깨지기 쉬운 사물의 경우 이를 고려하여 던지는 법을 학습하도록 하거나, 다른 로봇을 학습시켜 충격이 흡수되도록 사물을 받아내게 해야 하는 것 등이다. 

아울러 토싱봇은 제어 변수를 오직 시각 정보로부터 유추하는 데, 힘-토크 또는 촉각 등 다른 감각을 활용한다면 시스템이 새로운 사물에 더욱 잘 적응하도록 할 수 있을지도 모른다.

토싱봇을 가능하게 한 물리학과 딥러닝의 조합은 자연스럽게 흥미로운 질문을 이끌어낸다. 리지듀얼 피직스를 활용할 수 있는 분야는 또 없을까? 이 개념을 다른 형태의 과제와 상호작용으로 확장할 수 있는 가능성을 탐구하는 것은 유망한 연구방향이 될 것이다.

 

글 : 앤디 정(Andy Zeng) / 구글 로보틱스 학생연구원 / 프린스턴대학교·구글

 

최태우 기자  taewoo@itbiznews.com

<저작권자 © IT비즈뉴스-아이티비즈뉴스, 무단 전재 및 재배포 금지>

최태우 기자의 다른기사 보기
icon인기기사
Back to Top