Исследователи из Disney Research разработали метод обучения двуногих роботов контролируемому падению. Технология основана на обучении с подкреплением и балансирует между минимизацией ударов и достижением заданной конечной позы. Это первый общий подход к управляемому падению двуногих роботов в реальных условиях. При динамичных движениях двуногие роботы сталкиваются с риском падения, несмотря на достижения в области робастности контроллеров на основе обучения с подкреплением. Стандартные стратегии падения включают заморозку актуаторов с высокими коэффициентами или применение низких коэффициентов для податливости. Оба подхода обеспечивают ограниченную управляемость результирующего движения и приводят к высоким ударным нагрузкам. Метод использует функцию награды, которая комбинирует отслеживание конечной позы с минимизацией ударов и защитой критических компонентов робота. Для обеспечения робастности к широкому диапазону начальных условий падения и возможности задать произвольную конечную п