Найти тему
6060 подписчиков

В предыдущем материале мы говорили о том, что такое обучение с подкреплением. Там мы на интуитивном уровне разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач.


В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов.
В предыдущем материале мы говорили о том, что такое обучение с подкреплением.
Около минуты