6955 подписчиков

В предыдущем материале мы говорили о том, что такое обучение с подкреплением. Там мы на интуитивном уровне разобрались с тем, как работают механизмы RL, поговорили о том, как обучение с подкреплением применяется для решения практических задач.

В этом материале мы изучим математический аппарат RL, начав с его базовых принципов и дойдя до примеров применения этих принципов при проектировании RL-алгоритмов.

Около минуты

16 июня 2022