RL-Pytorch:不同强化学习算法的实现

时间:2024-03-12 06:47:58
【文件属性】:

文件名称:RL-Pytorch:不同强化学习算法的实现

文件大小:4.27MB

文件格式:ZIP

更新时间:2024-03-12 06:47:58

Python

强化学习算法-PyTorch 针对OpenAI体育馆环境的不同强化学习算法的PyTorch实现。 用法 要测试预先训练的网络:运行test.py或test_continuous.py 训练新网络:运行train.py或train_continuous.py 所有超参数都在train.py或train_continuous.py文件中 如果您尝试在操作维数= 1的环境中对其进行训练,请确保检查PPO类的update函数中的张量维,因为我已经使用过torch.squeeze()多次。 torch.squeeze()张量,使得没有长度= 1的尺寸( )。 收集经验的参与者数量=1。可以通过在PPO类中创建多个ActorCritic网络实例并使用它们来收集经验(如A3C和标准PPO)来轻松更改。 依存关系 经过培训和测试: Python 3.6 PyTorch 1.0 NumPy 1.1


【文件预览】:
RL-Pytorch-master
----test.py(2KB)
----train.py(2KB)
----gif()
--------PPO_LunarLander-v2.gif(1.16MB)
--------PPO_BipedalWalker-v2.gif(3.37MB)
----LICENSE(1KB)
----tool()
--------settings.py(576B)
--------memory.py(396B)
----train_continuous.py(2KB)
----test_continuous.py(2KB)
----prog()
--------trainer.py(4KB)
--------tester.py(2KB)
----README.md(2KB)
----algorithm()
--------ppo.py(3KB)
--------a2c.py(2KB)
--------__init__.py(42B)
--------network()

网友评论