51:051,0×00:00/51:05Подборкаspb_ai2 года назадПодписатьсяDRL Лекция 8. Model-based RL (читает Олег Свидченко)
54:321,0×00:00/54:32Подборкаspb_ai2 года назадПодписатьсяDRL Лекция 7. Distributed Reinforcement Learning (читает Олег Свидченко)
53:401,0×00:00/53:40Подборкаspb_ai2 года назадПодписатьсяDRL Лекция 6. Off-policy: DDPG, TD3 и SAC (читает Олег Свидченко)
01:00:431,0×00:00/01:00:43Подборкаspb_ai2 года назадПодписатьсяDRL Лекция 5. On-policy: TRPO and PPO (читает Олег Свидченко)
01:28:331,0×00:00/01:28:33Подборкаspb_ai2 года назадПодписатьсяDRL Лекция 4. On-policy: Policy gradient and Actor-Critic (читает Олег Свидченко)
01:24:011,0×00:00/01:24:01Подборкаspb_ai2 года назадПодписатьсяDRL Лекция 3. Deep Q-Network (читает Олег Свидченко)