文件名称:Hierarchical-Actor-Critic-HAC-PyTorch:适用于OpenAI体育馆环境的分级参与者评论(HAC)的PyTorch实施
文件大小:1.01MB
文件格式:ZIP
更新时间:2024-05-19 04:09:30
reinforcement-learning deep-reinforcement-learning openai-gym pytorch reinforcement-learning-algorithms
分级演员批判性HAC PyTorch 这是Hierarchical Actor Critic(HAC)算法的实现,该论文在针对OpenAI健身房环境的PyTorch中的《 (ICLR 2019)中进行了描述。 该算法通过将任务划分为短时中间目标(子目标)来学习达到目标状态。 用法 所有超参数都包含在train.py文件中。 要训练新的网络,请运行train.py 要测试经过预训练的网络,请运行test.py 要使用子目标(2或3级)渲染环境(Mountain Car和Pendulum),请将本地安装目录gym/envs/classic_control的gym文件替换gym/envs/classic_control中健身房文件夹中的文件,并将布尔render更改为True 实施细节 该代码是按照本文附录部分和官方存储库中所述的那样实现的,即,没有目标网络且具有有限的Q值。 Ac
【文件预览】:
Hierarchical-Actor-Critic-HAC-PyTorch-master
----README.md(2KB)
----test.py(3KB)
----train.py(4KB)
----LICENSE(1KB)
----gym()
--------rendering.py(12KB)
--------pendulum.py(7KB)
--------continuous_mountain_car.py(13KB)
----HAC.py(7KB)
----utils.py(1KB)
----DDPG.py(4KB)
----gif()
--------Pendulum-v0-2level.gif(267KB)
--------MountainCarContinuous-v0.gif(143KB)
--------MountainCarContinuous-v0-3level.gif(139KB)
----preTrained()
--------Pendulum-v0()
--------MountainCarContinuous-v0()