6060 подписчиков
В предыдущем материале мы говорили о том, что такое обучение с подкреплением. Там мы на интуитивном уровне разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач.
В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов.
Около минуты
16 июня 2022