文件名称:mbpo_pytorch:基于模型的强化学习算法MBPO的pytorch复制
文件大小:172KB
文件格式:ZIP
更新时间:2024-04-14 06:52:39
Python
概述 这是pytorch中基于模型的RL算法MBPO的重新实现,如下文所述:。 该代码基于的使用张量流集成模型重现了结果,但使用pytorch集成模型却表现出明显的性能下降。 这段代码使用pytorch重新实现了集成动力学模型,并缩小了差距。 转载结果 比较是在两个任务上完成的,而其他任务没有经过测试。 但是在经过测试的两个任务上,与官方的tensorflow代码相比,pytorch实现获得了类似的性能。 依存关系 MuJoCo 1.5和MuJoCo 2.0 用法 python main_mbpo.py --env_name'Walker2d-v2'--num_epoch 300 --model_type'pytorch' python main_mbpo.py --env_name'Hopper-v2'--num_epoch 300 --model_type'pytorch' 参考
【文件预览】:
mbpo_pytorch-main
----make_plot.py(859B)
----results()
--------walker2d.png(71KB)
--------hopper.png(71KB)
----__init__.py(0B)
----predict_env.py(4KB)
----sac()
--------main.py(6KB)
--------utils.py(965B)
--------LICENSE(1KB)
--------__init__.py(0B)
--------model.py(5KB)
--------README.md(3KB)
--------sac.py(6KB)
--------replay_memory.py(2KB)
----model.py(16KB)
----.gitignore(25B)
----sample_env.py(1KB)
----README.md(1KB)
----main_mbpo.py(15KB)
----tf_models()
--------utils.py(3KB)
--------fake_env.py(4KB)
--------tf_logging.py(4KB)
--------__init__.py(0B)
--------bnn.py(26KB)
--------fc.py(9KB)
--------constructor.py(3KB)