Китайские инженеры разработали фреймворк OmniXtreme, позволяющий обучить единую нейросетевую политику управления человекоподобным роботом сразу множеству экстремальных движений — от сальто и стоек на руках до брейк-данса и элементов боевых искусств. OmniXtreme решает проблему объединения разнообразных навыков в одной модели без падения качества выполнения. Препринт статьи опубликован на сайте arXiv.org, у проекта есть сайт с демонстрационными видео на GitHub. Обучение андроидов точному воспроизведению движений лежит в основе множества практических навыков, среди которых и манипуляции предметами, и взаимодействие с людьми. Методы обучения с подкреплением позволили роботам научиться точно повторять отдельные сложные движения, включая танцы и акробатику. Однако при попытке масштабировать подход и научить одного робота сразу большому набору разнообразных движений возникает проблема — качество повторения движений деградирует по мере роста их разнообразия и сложности. Контроллер начинает уср