Раньше нужно было тысячи раз падать, вставать и снова пробовать. А теперь появился тренажер, который анализирует каждое движение и подсказывает точные поправки - и ребенок учится в десять раз быстрее. Примерно то же самое произошло с роботами. В феврале 2026 года на воркшопе по машинному обучению в немецком Маннгейме исследователь Антонин Раффин из Германского аэрокосмического центра (DLR) рассказал, как новые методы обучения с подкреплением изменили скорость и качество тренировки роботов. Если говорить совсем просто - раньше робот-гуманоид, чтобы научиться делать паркур в компьютерной симуляции, требовал десять миллионов попыток. Сейчас - всего один миллион. Это как если бы вместо десяти лет обучения в школе ребенку хватало одного года. Новые алгоритмы, в частности улучшенный метод PPO с адаптивной настройкой, позволяют роботам усваивать навыки на 25% быстрее, а итоговый результат их работы улучшился на 40% по сравнению с прошлыми системами. Вдобавок, роботы теперь сходятся к правильн