pytorch-ddpg-naf:实现连续控制算法(DDPG和NAF)

时间:2024-05-30 12:26:23
【文件属性】:

文件名称:pytorch-ddpg-naf:实现连续控制算法(DDPG和NAF)

文件大小:9KB

文件格式:ZIP

更新时间:2024-05-30 12:26:23

reinforcement-learning deep-learning pytorch ddpg deep-deterministic-policy-gradient

弃用 该存储库已弃用,不再维护。 请在查看RL的最新实现以进行连续控制。 描述 重新实现并。 欢迎捐款。 如果您知道如何使其更稳定,请随时发送拉取请求。 跑步 使用默认的超参数。 对于NAF: python main.py --algo NAF --env-name HalfCheetah-v2 对于DDPG python main.py --algo DDPG --env-name HalfCheetah-v2


【文件预览】:
pytorch-ddpg-naf-master
----param_noise.py(2KB)
----main.py(6KB)
----ddpg.py(7KB)
----normalized_actions.py(474B)
----LICENSE.md(1KB)
----naf.py(5KB)
----README.md(733B)
----replay_memory.py(816B)
----ounoise.py(693B)

网友评论