Найти в Дзене
Войти
1,0×
DRL Лекция 2. Monte Carlo Control. Q-learning. Off-policy vs On-policy (читает Олег Свидченко)
6 просмотров · 2 года назад
00:00
/
01:15:27
spb_ai
68 подписчиков
Подписаться
Хотите видеть больше публикаций по теме «Экономика»?
Давайте
Курс по глубокому обучению с подкреплением
Подборка ·
spb_ai
· 2 из
8
Далее: DRL Лекция 3. Deep Q-Network (читает Олег Свидченко)
Курс по глубокому обучению с подкреплением
· 2 из
8
Экономика
10,02 млн интересуются
Следить за темой
2157989940.1772.1752619499581.46902