GAE:具有广义优势估计的强化学习算法下载

【文件属性】：

文件名称：GAE:具有广义优势估计的强化学习算法

文件大小：27.19MB

文件格式：ZIP

更新时间：2024-06-03 19:22:10

Python

具有广义优势估计的强化学习算法来源： : 可视化： : TensorFlow中实现的最新文献中已发布的强化学习算法的示例。我的大部分研究都是在连续领域中进行的，我并没有花太多时间在Atari等离散领域中进行测试。使用带有LSTM层的PPO解决了BipedalWalker-v2 实现的算法感谢DeepMind和OpenAI公开提供他们的研究。非常感谢TensorFlow社区。算法纸 PPO 盖伊除DPPG之外，所有算法均使用GAE 在可能的地方，我已经在策略和值函数中添加了一个LSTM层。这通常会使较复杂的环境更稳定（但速度较慢） PPO已完全工作，可以在MuJuCo中测试不同的环境了。来源： : 训练所有的Python脚本都是作为独立脚本编写的。只需像在单个文件中或在IDE中那样运行它们即可。模型和TensorBoard摘要与脚本保存在同

立即下载

秒客网

GAE:具有广义优势估计的强化学习算法

网友评论

相关文章