RL-Pytorch：不同强化学习算法的实现下载

【文件属性】：

文件名称：RL-Pytorch：不同强化学习算法的实现

文件大小：4.27MB

文件格式：ZIP

更新时间：2024-03-12 06:47:58

Python

强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。用法要测试预先训练的网络：运行test.py或test_continuous.py 训练新网络：运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中如果您尝试在操作维数= 1的环境中对其进行训练，请确保检查PPO类的update函数中的张量维，因为我已经使用过torch.squeeze()多次。 torch.squeeze()张量，使得没有长度= 1的尺寸（）。收集经验的参与者数量=1。可以通过在PPO类中创建多个ActorCritic网络实例并使用它们来收集经验（如A3C和标准PPO）来轻松更改。依存关系经过培训和测试： Python 3.6 PyTorch 1.0 NumPy 1.1

立即下载

【文件预览】：
RL-Pytorch-master
----test.py(2KB)
----train.py(2KB)
----gif()
--------PPO_LunarLander-v2.gif(1.16MB)
--------PPO_BipedalWalker-v2.gif(3.37MB)
----LICENSE(1KB)
----tool()
--------settings.py(576B)
--------memory.py(396B)
----train_continuous.py(2KB)
----test_continuous.py(2KB)
----prog()
--------trainer.py(4KB)
--------tester.py(2KB)
----README.md(2KB)
----algorithm()
--------ppo.py(3KB)
--------a2c.py(2KB)
--------__init__.py(42B)
--------network()

秒客网

RL-Pytorch：不同强化学习算法的实现

网友评论

相关文章