文件名称:DeepRL-Agents:深度强化学习代理
文件大小:87KB
文件格式:ZIP
更新时间:2024-03-08 00:11:41
JupyterNotebook
深度强化学习代理 该存储库包含以Tensorflow编写的强化学习算法的集合。 这里编写的ipython笔记本是与我在发布的仍在进行中的教程系列一起编写的。 如果您不熟悉强化学习,建议阅读随附的每种算法的文章。 该存储库当前包含以下算法: Q表-使用表解决随机环境问题的Q学习的实现。 Q-Network -Q-Learning的神经网络实现,用于解决与Q-Table中相同的环境。 简单策略-一种针对无状态环境(例如n型武装匪徒问题)的策略梯度方法的实现。 Contextual-Policy (上下文策略) -一种针对状态环境(例如上下文匪徒问题)的策略梯度方法的实现。 策略网络-一种神经网络策略梯度代理的实现,该代理解决具有状态和延迟奖励以及两个相反动作(即CartPole或Pong)的完整RL问题。 Vanilla-Policy-一种神经网络Vanilla- policy-
【文件预览】:
DeepRL-Agents-master
----helper.py(4KB)
----Deep-Recurrent-Q-Network.ipynb(21KB)
----gridworld.py(4KB)
----Simple-Policy.ipynb(8KB)
----Q-Exploration.ipynb(47KB)
----Q-Table.ipynb(5KB)
----LICENSE(1KB)
----Q-Network.ipynb(39KB)
----Vanilla-Policy.ipynb(8KB)
----Model-Network.ipynb(16KB)
----Contextual-Policy.ipynb(11KB)
----basic.wad(3KB)
----A3C-Doom.ipynb(22KB)
----README.md(2KB)
----Double-Dueling-DQN.ipynb(20KB)
----Policy-Network.ipynb(26KB)