DRL Лекция 2. Monte Carlo Control. Q-learning. Off-policy vs On-policy (читает Олег Свидченко) | spb_ai | Дзен

Найти в Дзене

Подписки

Видеоигры

Всё о Дзене ВакансииДзен на iOS и Android

1,0×

6 просмотров · 2 года назад

00:00/01:15:27

spb_ai

68 подписчиков

Хотите видеть больше публикаций по теме «Экономика»?

Курс по глубокому обучению с подкреплением

Подборка ·

spb_ai

· 2 из 8

Далее: DRL Лекция 3. Deep Q-Network (читает Олег Свидченко)

Курс по глубокому обучению с подкреплением · 2 из 8

Экономика

10,02 млн интересуются

2157989940.1772.1752619499581.46902