minimalRL:用最少的代码行实现基本的RL算法! (基于火炬)

时间:2024-02-23 23:32:40
【文件属性】:

文件名称:minimalRL:用最少的代码行实现基本的RL算法! (基于火炬)

文件大小:18KB

文件格式:ZIP

更新时间:2024-02-23 23:32:40

machine-learning reinforcement-learning deep-learning simple deep-reinforcement-learning

最小RL 用最少的代码行实现基本的RL算法! (基于PyTorch) 每种算法都在一个文件中完成。 每个文件的长度最多为100〜150行代码。 即使没有GPU,也可以在30秒内训练每种算法。 Env固定为“ CartPole-v1”。 您可以只关注实现。 演算法 (67行) (98行) (112行,包括重放内存和目标网络) (119条线,包括GAE) (145行,包括OU噪声和软目标更新) (129条线) (149条线) (188条线) (171行)已添加!! (161行)已添加!! 有什么建议吗? 依存关系 火炬 OpenAI健身 用法 # Works only with Python 3. # e.g. python3 REINFORCE.py python3 actor_critic.py python3 dqn.py python3 ppo.py python3 ddpg.py python3 a3c.py python3 a2c.py python3 acer.py python3 sac.py


【文件预览】:
minimalRL-master
----ppo-continuous.py(5KB)
----a3c.py(4KB)
----ppo-lstm.py(5KB)
----dqn.py(3KB)
----actor_critic.py(3KB)
----LICENSE(1KB)
----sac.py(6KB)
----ppo.py(4KB)
----README.md(2KB)
----a2c.py(6KB)
----ddpg.py(4KB)
----acer.py(5KB)
----REINFORCE.py(2KB)

网友评论