Найти в Дзене
У-Янус

Нейросети и шагающие роботы.

Laikago. Credit: Google
Laikago. Credit: Google

В недавней работе исследователи из Google Research и Университета Калифорнии в Беркли представили систему имитационного обучения, которая позволяет научить шагающих роботов разным видам локомоции.

Локомоция – это одна из главных характеристик любого животного, которая описывает его инстинктивные движения, необходимые для активного перемещения в пространстве. При этом локомоции животных одного вида обладают общими чертами, определяемыми опорно-двигательным аппаратом, совсем немного отличаясь для каждого отдельного животного.

Зачем это нужно? В основе лежит идея о том, что природа миллионы лет в процессе эволюции оттачивала искусство движения в животных. Поэтому логично предположить, что с точки зрения развития идеи шагающих роботов (колеса и гусеницы в животном мире пока не обнаружены, ага) наиболее экономичным будет путь копирования как особенностей опорно-двигательного аппарата, так и локомоции животных.

Чтобы построить шагающего робота необходимо решить две глобальные проблемы. Во-первых, необходимо создать собственно сам механический опорно-двигательный аппарат. А во-вторых, для устройства нужно написать управляющее программное обеспечение.

И если создание механизма является чисто инженерной задачей, к которой понятно как подступиться, то разработка управляющей программы представляется задачей значительно более сложной. Такая сложность в первую очередь обусловлена большим количеством реакций, которые должна обеспечивать программа в зависимости от обстановки, в которой действует робот. В природе такую задачу решает мозг животного, способный практически безошибочно делать выбор. При этом, чем большим опытом обладает животное, тем меньше мозг ошибается.

Обычный компьютер накапливать опыт не способен, поэтому в реализованной на нем управляющей программе необходимо будет прописывать реакции на каждое конкретное изменение обстановки. Такой подход подразумевает затратный по времени поиск подходящего решения среди заранее заданных реакций, что значительно повышает требования к быстродействию имитирующего мозг компьютера. Особенно, если мы хотим получить мало-мальски быстрого робота. Кроме того, учесть все возможные изменения обстановки невозможно в принципе, а значит, применение такого подхода имеет естественное ограничение в виде контролируемой среды. Если возникнут непрописанные изменения обстановки, то робот просто не будет знать, как ему на них реагировать.

Поэтому многие исследователи пошли другим путем, решив моделировать мозг с помощью искусственной нейросети, которая способна накапливать опыт и на его основе реагировать в условиях недостатка данных, т.е. реагировать на неожиданные изменения.

Исследователи же из Google Research и Университета Калифорнии предложили новый способ быстрой тренировки нейросети. Этот метод обучения подразумевает два этапа. Сначала нейросеть нарабатывает опыт в компьютерной симуляции, а не при управлении реальным устройством, что позволяет в десятки раз ускорить выработку первичных навыков у нейросети. После чего начинается тренировка по управлению реальным устройством.

В данном случае роль подопытного кролика сыграла собака, а ее механической моделью стал четвероногий робот Laikago с 18 степенями свободы, который может воспроизводить различные способы бега, прыжков и поворотов животных. В результате эксперимента роботу удалось автоматически создать программы для различных стилей передвижения и эффективно адаптировать к реальному миру навыки, полученные в симуляции.

-2

Весьма и весьма перспективная тема. И еще, интересный факт. В основе этой технологии симуляции лежат методы из компьютерной графики, благодаря которым движения нарисованного персонажа имитируют записанные движения реального человека. Неочевидная польза от компьютерных игр.

Learning agile robotic locomotion skills by imitating animals. arXiv:2004.00784 [cs.RO]. arxiv.org/abs/2004.00784

Мне важно Ваше мнение. Если нравится, ставьте лайк, подписывайтесь.