文件名称:deepDGP:TensorFlow中针对OpenAI-Gym环境的深度确定性策略梯度的实现
文件大小:41.37MB
文件格式:ZIP
更新时间:2024-05-28 05:52:48
Python
强化学习
深度确定性策略梯度
我们介绍由提出的名为DeepDGP的强化学习算法的实现 。
有关更多详细信息,请参阅我的。
训练有素的
使用说明
我们建议使用python 3。
pip3 install gym
pip3 install tensorflow
pip3 install tqdm
pip3 install matplotlib
要训练和运行,请从获得一个月的试用许可证。 如果您是使用.edu地址的学生,则可以免费获得1年MuJoCo许可证。
cd src
python3 train . py - - env_id = '
【文件预览】:
deepDGP-master
----src()
--------train.py(3KB)
--------compare_results.py(2KB)
--------noise.py(673B)
--------run.py(695B)
--------models.py(3KB)
--------ddpg.py(21KB)
--------__pycache__()
--------ReplayBuffer.py(2KB)
--------plot.py(1KB)
----trained_models()
--------HalfCheetah-v2()
--------HalfCheetah-v2-lessnoisy-30-rollouts()
--------Pendulum-v0()
----LICENSE(1KB)
----assets()
--------rewards.png(91KB)
--------overview.png(50KB)
--------train_errors.png(69KB)
----README.md(5KB)
----_config.yml(59B)