Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
요약
상세 내용
이러한 한계를 극복하기 위해, 본 연구는 이족(bimanual)이며 전신 제어(whole-body control)가 필요한 모바일 조작(mobile manipulation) 작업을 모방하기 위한 시스템을 개발한다. 핵심 제안은 "Mobile ALOHA"라는 저비용의 전신 텔레오퍼레이션(teleoperation) 시스템이다. 이 시스템은 기존의 ALOHA 시스템에 모바일 베이스(mobile base)와 전신 텔레오퍼레이션 인터페이스를 추가하여 데이터 수집을 위한 환경을 구축한다.
Mobile ALOHA를 통해 수집된 데이터를 사용하여 지도 행동 복제(supervised behavior cloning)를 수행한다. 특히, 기존의 정적(static) ALOHA 데이터셋과 함께 공동 훈련(co-training)하는 것이 모바일 조작 작업의 성능을 크게 향상시킨다는 점을 발견했다. 각 작업당 50개의 시연(demonstrations)만으로도 공동 훈련은 성공률(success rates)을 최대 90%까지 증가시킬 수 있다.
이러한 방법을 통해 Mobile ALOHA는 새우를 볶고 서빙하기, 무거운 요리 냄비를 보관하기 위해 두 개의 문이 달린 벽장을 여는 작업, 엘리베이터를 호출하고 탑승하는 작업, 주방 수도꼭지를 사용하여 사용된 팬을 가볍게 헹구는 작업과 같은 복잡한 모바일 조작 작업을 자율적으로 완료할 수 있음을 입증한다.
이 연구는 Boston Dynamics AI Institute와 ONR grant N00014-21-1-2685의 지원을 받았으며, Zipeng Fu는 Stanford Graduate Fellowship의 지원을 받았다.