Tensorflow_Deep_RL:深度强化学习算法的Tensorflow实现

时间:2024-05-17 19:53:21
【文件属性】:

文件名称:Tensorflow_Deep_RL:深度强化学习算法的Tensorflow实现

文件大小:4KB

文件格式:ZIP

更新时间:2024-05-17 19:53:21

reinforcement-learning deep-learning tensorflow parameter-space-noise-exploration Python

Tensorflow_Deep_RL 用于在体育馆环境中训练代理的多种算法的实现。 算法直接从研究论文中实现,并引用了参考文献。 探索的参数空间噪声 这项工作实现了OpenAi的“探索参数空间噪声”中的思想,并且在他们的工作中,对于某些环境(尤其是奖励稀少的环境),这种方法比动作空间探索训练得更快。 噪声的标准偏差在我的工作中是恒定的,但是可以随着训练的进行而对噪声进行退火,以寻求最佳解决方案。 必须对代理商进行多次培训,因为培训很可能陷入局部最优。 档名:param_noise_mlp.py 依存关系 需要Python 3.6和 , 和OpenAI 。 用法 python param_noise_mlp.py 图形 graph = tf . Graph () with graph . as_default (): x = tf . placeholder ( tf . f


【文件预览】:
Tensorflow_Deep_RL-master
----README.rst(4KB)
----param_noise_mlp.py(7KB)

网友评论