17 подписчиков

Робопёс МФТИ научился ходить по неровной поверхности с помощью нейросети

ВчераВчера

3 мин

Исследователи из лаборатории нейробиоморфных технологий МФТИ вместе с коллегами из Университета Лобачевского разработали четвероногого робота на базе SpotMicro. Машина умеет сохранять равновесие, двигаться симметричной походкой и корректировать шаг в реальном времени. Авторы работы связывают этот результат с комбинацией трёх компонентов: алгоритмов обучения с подкреплением, импульсных нейронных сетей и аппаратного ускорения на одноплатном компьютере Orange Pi 5B. Результаты опубликованы в «Российском журнале нелинейной динамики». Для российской робототехники это заметный кейс: команда использовала доступную открытую платформу и довела её до уровня, где можно обсуждать уже прикладные сценарии, а не лабораторный макет ради демонстрации. Базой стала конструкция с 12 степенями свободы: у каждой ноги по три управляемых сустава. Верхний уровень системы строит траекторию шага, средний рассчитывает нужные углы суставов, нижний отправляет команды сервоприводам с частотой 100 Гц. Такая схема даё

Оглавление

Платформа для ходьбы по сложному рельефу
Как обучали робота
Почему виртуальная тренировка сработала в реальности

Платформа для ходьбы по сложному рельефу

Результаты опубликованы в «Российском журнале нелинейной динамики». Для российской робототехники это заметный кейс: команда использовала доступную открытую платформу и довела её до уровня, где можно обсуждать уже прикладные сценарии, а не лабораторный макет ради демонстрации.

Как обучали робота

Базой стала конструкция с 12 степенями свободы: у каждой ноги по три управляемых сустава. Верхний уровень системы строит траекторию шага, средний рассчитывает нужные углы суставов, нижний отправляет команды сервоприводам с частотой 100 Гц. Такая схема даёт плавное движение, но на неровной поверхности одной кинематики недостаточно. Поэтому робота обучали через метод проб и ошибок в симуляторе PyBullet.

Во время тренировки виртуальный робопёс получал «награду» за устойчивое продвижение вперёд и штрафы за раскачивание, избыточные крены и падения. Разработчики сравнивали два подхода, Augmented Random Search и Soft Actor-Critic, а также задействовали импульсные нейронные сети. Они работают ближе к принципам биологических нейронов и позволяют экономнее расходовать вычислительные ресурсы, что особенно важно для автономной машины с ограниченным запасом энергии.

«Даже на относительно недорогой открытой платформе можно реализовать современные подходы к управлению. При этом энергозатраты существенно ниже, а это критично для автономного робота, работающего от аккумулятора», - пояснил научный сотрудник лаборатории нейробиоморфных технологий МФТИ Артём Губа.

Почему виртуальная тренировка сработала в реальности

Один из самых сложных этапов в такой работе - перенос поведения из симулятора в физический прототип. В виртуальной среде нет точного аналога шумов датчиков, люфтов приводов и изменений трения на покрытии. Чтобы сократить этот разрыв, исследователи рандомизировали параметры среды: меняли массу, характеристики моторов и коэффициенты трения. Для обработки сигналов с инерциальных датчиков команда также применила фильтр Калмана и медианную фильтрацию.

В роли вычислительного центра использовали Orange Pi 5B на чипе Rockchip RK3588S со встроенным NPU, то есть нейропроцессором для ускорения задач ИИ. Модель сначала обучали в PyTorch, затем экспортировали в ONNX и конвертировали в формат RKNN для запуска на аппаратном ускорителе. Такой стек выглядит прагматично: разработчики строят систему, которую можно уместить в компактный корпус без тяжёлой и прожорливой электроники.

Какие результаты уже получены

Эксперименты на реальном роботе показали, что после 400 тысяч шагов обучения система прогнозирует углы суставов с ошибкой около 5%, а медианное отклонение составляет примерно 3 градуса. Для сравнения, на раннем этапе, после 1 тысячи шагов, ошибка доходила до 20%, а медианное отклонение было около 18 градусов. По данным авторов, импульсная нейросеть обучалась быстрее классической архитектуры и раньше выходила на устойчивый режим работы.

Практический смысл у такой разработки вполне читаемый. Четвероногие машины лучше колёсных платформ чувствуют себя на пересечённой местности, лестницах и в узких проходах. Поэтому у проекта просматриваются сценарии для поисково-спасательных операций, обследования объектов, экологического мониторинга и автономных машин, которым нужен уверенный ход по нестабильной поверхности. В ближайшей перспективе главным тестом для команды станет переход от лабораторных условий к длинным полевым испытаниям, где проверяется уже не красота алгоритма, а запас устойчивости всей системы.