GAE:具有广义优势估计的强化学习算法

时间:2024-06-03 19:22:10
【文件属性】:

文件名称:GAE:具有广义优势估计的强化学习算法

文件大小:27.19MB

文件格式:ZIP

更新时间:2024-06-03 19:22:10

Python

具有广义优势估计的强化学习算法 来源: : 可视化: : TensorFlow中实现的最新文献中已发布的强化学习算法的示例。 我的大部分研究都是在连续领域中进行的,我并没有花太多时间在Atari等离散领域中进行测试。 使用带有LSTM层的PPO解决了BipedalWalker-v2 实现的算法 感谢DeepMind和OpenAI公开提供他们的研究。 非常感谢TensorFlow社区。 算法 纸 PPO 盖伊 除DPPG之外,所有算法均使用GAE 在可能的地方,我已经在策略和值函数中添加了一个LSTM层。 这通常会使较复杂的环境更稳定(但速度较慢) PPO已完全工作,可以在MuJuCo中测试不同的环境了。 来源: : 训练 所有的Python脚本都是作为独立脚本编写的。 只需像在单个文件中或在IDE中那样运行它们即可。 模型和TensorBoard摘要与脚本保存在同


网友评论