文件名称:打击迹线的matlab代码-The-Mean-Squared-Error-of-Double-Q-Learning:双Q学习的均方误差
文件大小:58KB
文件格式:ZIP
更新时间:2024-06-23 23:44:27
系统开源
捣迹线的matlab代码双Q学习的均方误差 这是 Neurips 2020 论文“双 Q 学习的均方误差”的复制代码 我们针对不同的环境测试了 Double Q-learning 和 Q-learning。 以下所有实验均使用 Matlab R2018b 和 Python 3.6.9 运行 我们考虑的环境 贝尔德的例子:贝尔德 GridWorld:网格 CartPole:手推车 最大化偏差:偏差,偏差(nn) 贝尔德的实验 文件: bairds/GenBaird.m bairds/simulation_baird.m bairds/plot.py 在simulation_baird.m中,改变输入到函数GenBaird来模拟不同的设置 运行simulation_baird.m,它会生成几个文件,含义与后面指定的GridWorld相同。 绘制均方误差的轨迹:python3 plot.py 网格世界实验 文件: 网格/GenGrid.m 网格/simulation_grid.m 网格/plot.py 在simulation_grid.m中,改变输入到函数GenGrid来模拟不同大小的Gri
【文件预览】:
The-Mean-Squared-Error-of-Double-Q-Learning-main
----LICENSE(1KB)
----Bias()
--------plot.py(2KB)
--------bias.py(6KB)
--------Sutton-Barto(tabular).pdf(28KB)
----README.md(4KB)
----bairds()
--------plot.py(2KB)
--------simulation_baird.m(8KB)
--------GenBaird.m(1KB)
----cartpole()
--------cartpole.py(8KB)
--------plot.py(3KB)
----Bias(nn)()
--------Sutton-Barto(nn).pdf(28KB)
--------plot.py(2KB)
--------bias(nn).py(8KB)