Русские видео

Сейчас в тренде

Иностранные видео




Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса savevideohd.ru



深度强化学习(3/5):策略学习 Policy-Based Reinforcement Learning

这节课讲Policy-Based Reinforcement Learning (策略学习)。主要内容是Policy Network (策略网络)和Policy Gradient (策略梯度)算法。 这节课主要内容: 0:22 Policy Network (策略网络) 3:52 State-Value Function (状态价值函数) 6:12 Policy-Based Learning (策略学习) 8:51 Policy Gradient (策略梯度) 17:20 用策略梯度学习策略网络 21:05 总结 强化学习基础: 1. 基本概念:   • 深度强化学习(1/5):基本概念  Deep Reinforcement ...   2. 价值学习:   • 深度强化学习(2/5):价值学习  Value-Based Reinfor...   3. 策略学习:   • 深度强化学习(3/5):策略学习  Policy-Based Reinfo...   4. Actor-Critic:   • 深度强化学习(4/5):Actor-Critic Methods   5. AlphaGo:   • 深度强化学习(5/5):AlphaGo & Model-Based RL   课件:https://github.com/wangshusen/DRL

Comments