DRL:深度强化学习

时间:2021-03-31 17:44:24
【文件属性】:
文件名称:DRL:深度强化学习
文件大小:18.58MB
文件格式:ZIP
更新时间:2021-03-31 17:44:24
深度强化学习 概述。 强化学习[] [] []。 基于价值的学习[] []。 基于策略的学习[] []。 演员批评方法[] []。 AlphaGo [] []。 TD学习。 Sarsa [] []。 Q学习[] []。 多步TD目标[] []。 基于价值的学习的高级主题。 体验重播(ER)和优先级ER [] []。 高估,目标网络和双重DQN [] []。 决斗网络[] []。 具有基线的策略梯度。 具有基线的政策梯度[] []。 带有基线的REINFORCE [] []。 优势演员评判(A2C)[] []。 REINFORCE与A2C [] []。 基于策略的学习的高级主题。 信任区域策略优化(TRPO)[] []。 部分观察和RNN。 处理连续动作空间。 离散控制与连续控制[] []。 连续控制的确定性策略梯度(DPG)[] []。 连
【文件预览】:
DRL-master
----Slides()
--------2_TD_3.pdf(83KB)
--------6_Continuous_3.pdf(248KB)
--------6_Continuous_2.pdf(193KB)
--------6_Continuous_1.pdf(224KB)
--------7_MARL_2.pdf(402KB)
--------3_DQN_1.pdf(389KB)
--------4_Policy_4.pdf(267KB)
--------3_DQN_3.pdf(374KB)
--------4_Policy_2.pdf(347KB)
--------7_MARL_1.pdf(1.45MB)
--------1_Basics_4.pdf(483KB)
--------1_Basics_2.pdf(410KB)
--------3_DQN_2.pdf(368KB)
--------2_TD_2.pdf(281KB)
--------1_Basics_3.pdf(431KB)
--------1_Basics_5.pdf(2.08MB)
--------4_Policy_1.pdf(188KB)
--------5_Policy_1.pdf(271KB)
--------2_TD_1.pdf(305KB)
--------1_Basics_1.pdf(1.38MB)
--------4_Policy_3.pdf(394KB)
----LICENSE(306B)
----Notes_CN()
--------DRL.pdf(11.46MB)
----README.md(4KB)

网友评论