【文件属性】:
文件名称:DRL:深度强化学习
文件大小:18.58MB
文件格式:ZIP
更新时间:2021-03-31 17:44:24
深度强化学习
概述。
强化学习[] [] []。
基于价值的学习[] []。
基于策略的学习[] []。
演员批评方法[] []。
AlphaGo [] []。
TD学习。
Sarsa [] []。
Q学习[] []。
多步TD目标[] []。
基于价值的学习的高级主题。
体验重播(ER)和优先级ER [] []。
高估,目标网络和双重DQN [] []。
决斗网络[] []。
具有基线的策略梯度。
具有基线的政策梯度[] []。
带有基线的REINFORCE [] []。
优势演员评判(A2C)[] []。
REINFORCE与A2C [] []。
基于策略的学习的高级主题。
信任区域策略优化(TRPO)[] []。
部分观察和RNN。
处理连续动作空间。
离散控制与连续控制[] []。
连续控制的确定性策略梯度(DPG)[] []。
连
【文件预览】:
DRL-master
----Slides()
--------2_TD_3.pdf(83KB)
--------6_Continuous_3.pdf(248KB)
--------6_Continuous_2.pdf(193KB)
--------6_Continuous_1.pdf(224KB)
--------7_MARL_2.pdf(402KB)
--------3_DQN_1.pdf(389KB)
--------4_Policy_4.pdf(267KB)
--------3_DQN_3.pdf(374KB)
--------4_Policy_2.pdf(347KB)
--------7_MARL_1.pdf(1.45MB)
--------1_Basics_4.pdf(483KB)
--------1_Basics_2.pdf(410KB)
--------3_DQN_2.pdf(368KB)
--------2_TD_2.pdf(281KB)
--------1_Basics_3.pdf(431KB)
--------1_Basics_5.pdf(2.08MB)
--------4_Policy_1.pdf(188KB)
--------5_Policy_1.pdf(271KB)
--------2_TD_1.pdf(305KB)
--------1_Basics_1.pdf(1.38MB)
--------4_Policy_3.pdf(394KB)
----LICENSE(306B)
----Notes_CN()
--------DRL.pdf(11.46MB)
----README.md(4KB)