KAIST, 주변 보지 않고도 씩씩하게 잘 걷는 사족보행 로봇 개발

센서 정보와 AI 학습, 비정형 환경에서 주변 지형 보지 않고 사족보행 가능

과학입력 :2023/03/29 10:30

밤에 자다 깨어 화장실에 갈 때, 불이 꺼져 있어 캄캄해도 큰 문제 없이 걸어갈 수 있다.

KAIST(총장 이광형)는 사람과 같이 주변 지형을 보지 않고도 센서로 들어오는 정보만 활용해 주변 지형을 감지하고 잘 걸을 수 있는 사족보행 로봇을 개발했다고 29일 밝혔다.

관절 엔코더와 관성센서 등의 센서 정보만 활용해 주변 지형을 감지, 재난 상황이나 건설 현장 같은 비정형 환경에서도 안정적으로 움직일 수 있다.

연구팀이 개발한 제어기, 드림워크(DreamWaQ)의 개요도. 이 네트워크는 암시적 및 명시적 추정을 함께 학습하는 추정기 네트워크, 제어기로 작동하는 정책 네트워크 및 훈련 중 정책을 안내하는 가치 네트워크로 구성된다. 실제 로봇에 구현할 때는 추정기와 정책 네트워크만 사용된다. 두 네트워크 모두 로봇에 탑재된 온보드 컴퓨터에서 1ms 미만으로 실행된다. (자료=KAIST)

KAIST 전기전자공학부 명현 교수 연구팀이 개발한  로봇 보행 제어 기술 '드림워크(DreamWaQ)'는 지면과 로봇의 정보를 추정하는 상황 추정 네트워크와 제어 명령을 산출하는 정책 네트워크로 구성된다. 두 네트워크는 시뮬레이션을 통해 함께 학습된다.

상황추정 네트워크는 로봇의 관성과 관절 움직임을 알려주는 센서를 통해 지면과 로봇의 상태를 추정한다. 이 정보는 정책 네트워크에 입력돼 최적의 제어 명령을 내리는데 쓰인다.

정책 네트워크는 시뮬레이션 안에서 심층 강화학습 방법의 하나인 '행동자-비평자' 방식으로 학습된다. 행동자 네트워크는 환경을 볼 수 없고 추정만 할 수 있다. 행동자의 행동은 지형 정보를 알고 있는 비평자 네트워크에 의해 평가되어 개선된다.

이같은 학습 과정은 1시간 정도 소요되며, 실제 로봇에는 행동자 네트워크만 탑재된다. 주변 지형을 보지 않고, 오직 로봇 내부 관성 센서와 관절 각도의 측정치를 활용해 시뮬레이션에서 학습한 환경 중 어느 환경과 유사한지 상상하는 과정을 거친다. 갑자기 계단을 만날 경우, 발이 단차에 닿기 전까지는 알 수 없지만 발이 닿는 순간 빠르게 지형 정보를 상상한다. 이렇게 추측된 지형 정보에 알맞은 제어 명령을 각 모터에 전달해 재빨리 적응해 걷는다. 

관련기사

이 기술을 적용한 '드림워커(DreamWaQer)' 로봇은 지면과 몸체까지 높이의 3분의 2 정도 되는 계단을 성공적으로 오르는 모습을 보였다. 연석과 과속방지턱이 많은 대학 캠퍼스나 나무뿌리와 자갈이 많은 야지 등 환경에 무관하게 0.3m/s의 느린 속도부터 1.0m/s의 다소 빠른 속도까지도 안정적 보행이 가능했다.

이 연구는 5월 말 영국 런던에서 열리는 로보틱스 분야 학회 'ICRA (IEEE International Conference on Robotics and Automation)'에서 발표될 예정이다.