Люди выполняют сложные задачи в условиях неопределенности и изменений окружающей среды с минимальными усилиями. Они способны адаптироваться к новым препятствиям, исходя из своих двигательных способностей.
Напротив, современные роботы в значительной степени полагаются на хорошо смоделированную среду с точно рассчитанными параметрами. Таким образом, изменения в окружающей среде или задача требуют от специалиста программирования новых правил моторного поведения.
Чтобы решить эту проблему, роботы должны научиться самостоятельно осваивать новые двигательные навыки и совершенствовать свои способности. Хотя эта проблема была признана робототехническим сообществом, она еще далека от решения.
Вместо этого, обучение новым задачам автономно и адаптация навыков онлайн при взаимодействии с окружающей средой стали важной целью как в робототехнике, так и в машинном обучении. В последние годы стало общепризнанным, что для решения сложных задач, связанных с обучением роботов моторным навыкам, мы должны полагаться на понимание того, что люди распределяют задачи на более мелкие подзадачи. Эти подзадачи могут быть решены с помощью небольшого числа генераторов обобщаемых моделей движения, также называемых примитивами движения.
Примитивы движения - это последовательности команд двигателя, выполняемые для выполнения заданной задачи. Обучение на демонстрациях может стать хорошей отправной точкой для обучения моторным навыкам, поскольку позволяет эффективно приобретать примитивы для одного движения.
Большинство подходов к имитации обучения роботов основаны либо на физических демонстрациях последовательности движения робота с помощью кинестетического обучения , либо на использовании системы захвата движения, такой как VICON. Для представления примитивов движения таким образом, чтобы они могли адаптировать траектории, полученные имитацией обучения, к требованиям текущей задачи, было предложено несколько методов.
Несколько подходов используют формулы, основанные на использовании сплайнов для интерполяции между промежуточными точками, Hidden Markov Models (HMM) или Gaussian Mixture Models (GMMs). Хотя эти подходы благоприятны во многих ситуациях, сплайновые модели, основанные на транзитных точках, которые трудно использовать в новых ситуациях, в то время как HMMM и GMM трудно обучать для высокомерных систем.
Таким образом, альтернативный подход, основанный на динамических системах, был назван DMPs (Dynamical system Motor Primitives). DMP устойчивы к возмущениям, позволяют изменять конечное состояние, скорость и длительность движения без изменения общей формы движения. Кроме того, они просты в обучении с помощью имитации обучения и хорошо подходят для самосовершенствования, основанного на вознаграждении.
DMP успешно используются для изучения различных моторных навыков в робототехнике, включая плоскую двустворчатую ходьбу.
Однако, до сих пор, большинство приложений обучения и самосовершенствования DMP используют только отдельные движения примитивов, чтобы представить все моторное мастерство. Исключением является работа, в которой внутренние параметры DMP пересчитываются из библиотеки примитивов движения в каждом исследовании с использованием локально взвешенной регрессии.
В заключении
Тем не менее, сложные задачи двигателя требуют несколько примитивов движения, которые используются в ответ на стимул окружающей среды и использование должно быть адаптировано в соответствии с производительностью.