228 подписчиков

Могут ли роботы вальсировать?

1 сентября 20201 сен 2020

2 мин

Я уже писал об имитационной методике обучения нейросети, управляющей шагающими роботами. Краеугольным камнем той методики было использование записи локомоции, инстинктивных движений животных при активных перемещениях в пространстве. В этот раз я расскажу о новой технологии, предложенной исследователями из Эдинбургского университета, о расширенной программе обучения, с помощью которой нейросети удается обучить управлению даже такими неустойчивыми платформами как гуманоидные роботы.

Сразу отмечу две ключевые концепции, без которых трудно оценить преимущества нового подхода. Одним из наиболее эффективных способов обучения нейросетей является метод обучения с подкреплением. В основе такого обучения лежит постоянная реакция на действия нейросети со стороны обучающей системы в соответствии с заложенными в нее изначально «правилами игры». Такой подход пользуется неизменной популярностью, так как позволяет тренировать нейросеть без активного вмешательства человека. Второй важный метод носит название «имитационного обучения» и подразумевает создание для нейросети базы данных о возможных реакциях, основанной на поведении реальных живых организмов. Совмещение этих двух концепций и является сутью новой методики обучения – ученым удалось включить в процесс глубокого обучения с подкреплением данные по движению реального человека, что существенно повысило эффективность тренировки нейросетей, составляющих управляющий модуль гуманоидного робота.

Дополнительный положительный эффект удалось получить за счет аппаратного разделения управляющей системы на два блока с собственными нейросетями, когда один отвечает за выбор оптимального маршрута, а другой определяет подходящий каждому участку пути стиль ходьбы. Эксперимент показывает, что в этом случае движение робота может быть устойчивым даже тогда, когда возникают неожиданные и незнакомые по тренировкам препятствия.

Все вместе это означает, что за счет правильного подхода к тренировке нейросетей и удачной аппаратной архитектуры ученым удалось разработать такую систему управления, которая в перспективе может заставить гуманоидного робота двигаться в пространстве так, как это делал бы реальный человек. Понятно, что это дело туманного будущего, хотя бы потому, что сейчас просто нет гуманоидной платформы, которая могла бы действительно похоже воспроизвести движения человека. Так что танцы пока откладываются по инженерным соображениям. Но технологии не стоят на месте, как мы знаем.

В любом случае, авторы горят энтузиазмом, собираются испытать свой управляющий блок на существующих платформах, а я желаю им удачи.

Большое, связанное с темой видео.

Learning natural locomotion behaviors for humanoid robots using human knowledge. arXiv:2005.10195 [cs.RO]. arxiv.org/abs/2005.10195

Мне важно Ваше мнение. Если нравится, ставьте лайк, подписывайтесь.