spb_ai
58 подписчиков
Курс по глубокому обучению с подкреплением
Подборка · 
spb_ai
 · 1 из 8
Далее: DRL Лекция 2. Monte Carlo Control. Q-learning. Off-policy vs On-policy (читает Олег Свидченко)
Курс по глубокому обучению с подкреплением · 1 из 8