ddpg-aigym:具有深度强化学习的连续控制-在OpenAI Gym环境中实现的深度确定性策略梯度(DDPG)算法

时间:2024-02-26 22:59:48
【文件属性】:

文件名称:ddpg-aigym:具有深度强化学习的连续控制-在OpenAI Gym环境中实现的深度确定性策略梯度(DDPG)算法

文件大小:322KB

文件格式:ZIP

更新时间:2024-02-26 22:59:48

reinforcement-learning deep-learning tensorflow TensorflowPython

ddpg-aigym 深度确定性策略梯度 Tensorflow中深度确定性策略梯度算法的实现(Lillicrap等人 。) 如何使用 git clone https://github.com/stevenpjg/ddpg-aigym.git cd ddpg-aigym python main.py 培训期间 一旦训练 学习曲线 InvertedPendulum-v1环境的学习曲线。 依存关系 Tensorflow(在tensorflow版本0.11.0rc0 ) OpenAi体育馆 Mujoco 产品特点 批量归一化(提高学习速度) 梯度转换器(在arXiv中提供: ) 注意 使用不同


【文件预览】:
ddpg-aigym-master
----critic_net.py(6KB)
----actor_net.pyc(4KB)
----main.py(3KB)
----ddpg.py(5KB)
----actor_net.py(4KB)
----learning_curve.png(334KB)
----critic_net.pyc(5KB)
----DDPG.pyc(2KB)
----tf.gradients_eg()
--------tf.gradients_eg.py(2KB)
--------README.md(233B)
----tensorflow_grad_inverter.py(1KB)
----critic_net_bn.py(7KB)
----LICENSE(1KB)
----tensorflow_session.py(62B)
----ddpg.pyc(3KB)
----result_plot.py(248B)
----episode_reward.txt(25KB)
----batch_normalization()
--------batch_norm.py(2KB)
--------__init__.py(0B)
----README.md(1KB)
----ou_noise.py(1006B)
----actor_net_bn.py(6KB)

网友评论