목록으로
Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation
Paper2025.05.18

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation

요약

Mobile ALOHA는 bimanual 및 whole-body control이 필요한 mobile manipulation task를 위한 데이터 수집을 위해 저비용의 teleoperation 시스템으로 개발되었습니다.
이 연구는 Mobile ALOHA로 수집된 데이터를 사용하여 supervised behavior cloning을 수행했으며, 기존 ALOHA 데이터셋과의 co-training이 mobile manipulation task의 성능을 크게 향상시킴을 발견했습니다.
50개의 demonstration만으로 co-training은 성공률을 최대 90%까지 높여, 로봇이 새우 볶기, 캐비닛 열기, 엘리베이터 호출 등 복잡한 mobile manipulation task를 자율적으로 완료할 수 있게 합니다.

상세 내용

이 논문은 로봇 공학에서 모방 학습(imitation learning)이 인상적인 성능을 보여왔지만, 대부분의 연구가 테이블탑(table-top) 조작에 초점을 맞춰 실제적이고 유용한 작업을 위한 이동성(mobility)과 민첩성(dexterity)이 부족하다는 문제점을 제기한다.

이러한 한계를 극복하기 위해, 본 연구는 이족(bimanual)이며 전신 제어(whole-body control)가 필요한 모바일 조작(mobile manipulation) 작업을 모방하기 위한 시스템을 개발한다. 핵심 제안은 "Mobile ALOHA"라는 저비용의 전신 텔레오퍼레이션(teleoperation) 시스템이다. 이 시스템은 기존의 ALOHA 시스템에 모바일 베이스(mobile base)와 전신 텔레오퍼레이션 인터페이스를 추가하여 데이터 수집을 위한 환경을 구축한다.

Mobile ALOHA를 통해 수집된 데이터를 사용하여 지도 행동 복제(supervised behavior cloning)를 수행한다. 특히, 기존의 정적(static) ALOHA 데이터셋과 함께 공동 훈련(co-training)하는 것이 모바일 조작 작업의 성능을 크게 향상시킨다는 점을 발견했다. 각 작업당 50개의 시연(demonstrations)만으로도 공동 훈련은 성공률(success rates)을 최대 90%까지 증가시킬 수 있다.

이러한 방법을 통해 Mobile ALOHA는 새우를 볶고 서빙하기, 무거운 요리 냄비를 보관하기 위해 두 개의 문이 달린 벽장을 여는 작업, 엘리베이터를 호출하고 탑승하는 작업, 주방 수도꼭지를 사용하여 사용된 팬을 가볍게 헹구는 작업과 같은 복잡한 모바일 조작 작업을 자율적으로 완료할 수 있음을 입증한다.

이 연구는 Boston Dynamics AI Institute와 ONR grant N00014-21-1-2685의 지원을 받았으며, Zipeng Fu는 Stanford Graduate Fellowship의 지원을 받았다.

원본 보기
Web
Shared by Anonymous