Python-PyTorch实现TrustRegionPolicyOptimization信任区域策略优化算法

时间:2022-08-30 20:26:06
【文件属性】:

文件名称:Python-PyTorch实现TrustRegionPolicyOptimization信任区域策略优化算法

文件大小:8KB

文件格式:ZIP

更新时间:2022-08-30 20:26:06

Python开发-机器学习

PyTorch实现(Trust Region Policy Optimization,信任区域策略优化)算法


【文件预览】:
pytorch-trpo-master
----trpo.py(3KB)
----utils.py(1KB)
----main.py(6KB)
----models.py(1KB)
----LICENSE.md(1KB)
----README.md(1KB)
----conjugate_gradients.py(774B)
----replay_memory.py(603B)
----running_state.py(2KB)

网友评论