AI 심층강화학습 기반 로봇제어 기술…재난로봇 활동범위 확대 

드림워크 개요도 [사진=KAIST]
드림워크 개요도 [사진=KAIST]

카이스트(KAIST)는 전기·전자공학부 명현 교수 연구팀이 ‘블라인드 보행'이 가능한 보행 로봇 제어 기술을 개발했다고 전했다. 연구팀이 개발한 이 로봇 제어 기술은 다양한 비정형 환경에서 로봇이 제약없이 활동할 수 있어 재난 로봇 등에서 유용하다.

기구학이나 동역학 모델을 기반으로 하는 기존 보행 로봇 제어 기술은 야지와 같은 비정형 환경에서 활용하기에 한계가 있다. 주변 환경을 인지할 수 있는 능력에 의존하고, 모델의 특징 정보를 빠르게 얻을 수 있어야 안정적인 보행이 가능하기 때문이다. 

명현 교수 연구팀이 이번에 개발한 로봇 제어 기술은 심층 강화학습으로 학습된 인공지능(AI)을 바탕으로 시뮬레이터로부터 얻어진 다양한 환경의 데이터를 통해 로봇의 각 모터에 적절한 제어 명령을 빠르게 계산해 줄 수 있어 기존 보행 로봇의 제약을 제거할 수 있다.

특히 시각, 촉각 등에 의존하지 않아 조명이 없거나 연기 등으로 물체나 지형을 볼 수 없는 보이지 않는 상황에서도 원활한 보행이 가능하다는 게 연구팀의 설명이다.

드림워크는 크게 지면과 로봇의 정보를 추정하는 상황 추정 네트워크와 제어 명령을 산출하는 정책(policy) 네트워크로 구성된다.

상황추정 네트워크는 관성 정보와 관절 정보들을 통해 암시적으로 지면의 정보를, 명시적으로 로봇의 상태를 추정하며, 이 정보는 정책 네트워크에 입력돼 최적의 제어 명령을 산출하는 데 사용된다. 2개 네트워크 모두 시뮬레이션에서 함께 학습된다.

상황추정 네트워크는 지도학습을 통해 학습되는 반면, 정책 네트워크는 심층 강화학습 방법론인 행동자-비평자 방식을 통해 학습된다. 행동자 네트워크는 주변 지형 정보를 오직 암시적으로 추정할 수 있다.

시뮬레이션에서는 주변 지형 정보를 알 수 있는데, 지형 정보를 알고 있는 비평자 네트워크가 행동자 네트워크의 정책을 평가한다.

이 모든 학습 과정에는 단 1시간 정도만 소요되며, 실제 로봇에는 학습된 행동자 네트워크만 탑재된다. 별도의 튜닝 과정도 필요치 않아 다양한 보행 로봇에 쉽게 적용될 수 있다.

드림워커 로봇은 실험실 연석과 과속방지턱이 많은 대학 캠퍼스 환경, 나무뿌리와 자갈이 많은 야지 환경 등에서 보행 시 지면으로부터 몸체까지 높이의 3분의 2 (2/3) 정도의 계단 오르기도 가능하며 환경과 무관하게 0.3m/s의 느린 속도부터 1.0m/s의 다소 빠른 속도까지도 안정적인 보행이 가능하다고 연구팀은 설명했다.

관련기사

저작권자 © ITBizNews 무단전재 및 재배포 금지