Русские видео

Сейчас в тренде

Иностранные видео




Если кнопки скачивания не загрузились НАЖМИТЕ ЗДЕСЬ или обновите страницу
Если возникают проблемы со скачиванием, пожалуйста напишите в поддержку по адресу внизу страницы.
Спасибо за использование сервиса savevideohd.ru



深度强化学习(2/5):价值学习 Value-Based Reinforcement Learning

这节课讲Value-Based Reinforcement Learning (价值学习)。这节课的主要内容是Deep Q Network (DQN)和Temporal Different (TD)算法。 这节课的主要内容: 0:12 复习Value Functions (价值函数) 3:05 Deep Q Network (DQN) 8:22 用个简单的例子讲解Temporal Different (TD)算法 15:49 用TD算法训练DQN 23:40 总结本节课内容 强化学习基础: 1. 基本概念:   • 深度强化学习(1/5):基本概念  Deep Reinforcement ...   2. 价值学习:   • 深度强化学习(2/5):价值学习  Value-Based Reinfor...   3. 策略学习:   • 深度强化学习(3/5):策略学习  Policy-Based Reinfo...   4. Actor-Critic:   • 深度强化学习(4/5):Actor-Critic Methods   5. AlphaGo:   • 深度强化学习(5/5):AlphaGo & Model-Based RL   课件:https://github.com/wangshusen/DRL

Comments