文件名称:Python-PyTorch实现TrustRegionPolicyOptimization信任区域策略优化算法
文件大小:8KB
文件格式:ZIP
更新时间:2022-08-30 20:26:06
Python开发-机器学习
PyTorch实现(Trust Region Policy Optimization,信任区域策略优化)算法
【文件预览】:
pytorch-trpo-master
----trpo.py(3KB)
----utils.py(1KB)
----main.py(6KB)
----models.py(1KB)
----LICENSE.md(1KB)
----README.md(1KB)
----conjugate_gradients.py(774B)
----replay_memory.py(603B)
----running_state.py(2KB)