文件名称:svrg_for_policy_evaluation_with_fewer_gradients
文件大小:3.11MB
文件格式:ZIP
更新时间:2024-03-08 13:47:34
Python
“用于梯度评估较少的政策评估的SVRG”的代码 依存关系 - blas=1.0=mkl - ca-certificates=2020.10.14=0 - certifi=2020.11.8=py36hecd8cb5_0 - cffi=1.14.4=py36h2125817_0 - intel-openmp=2019.4=233 - libcxx=10.0.0=1 - libedit=3.1.20191231=h1de35cc_1 - libffi=3.3=hb1e8313_2 - mkl=2019.4=233 - mkl-service=2.3.0=py36h9ed2024_0 - mkl_fft=1.2.0=py36hc64f4ea_0 - mkl_random=1.1.1=py36h959d312_0 - ncurses=6.2=h0
【文件预览】:
svrg_for_policy_evaluation_with_fewer_gradients-master
----SVRG.py(25KB)
----figure_2.py(2KB)
----TD_algorithms.py(7KB)
----optim_alg.py(9KB)
----policy_iteration.py(66KB)
----table_3.py(16KB)
----agent_env.py(3KB)
----figure_1.py(6KB)
----LICENSE(1KB)
----MDP_env.py(30KB)
----README.md(2KB)
----experiment_Setup.py(4KB)
----msc_thesis.pdf(3.69MB)
----mspbe.py(8KB)