【文件属性】:
文件名称:强化:与Sutton&Barto教科书相关的完整章节练习:强化学习-简介
文件大小:2KB
文件格式:ZIP
更新时间:2021-03-03 17:25:36
Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。
章节:
1:简介
第一部分:表格求解方法
2:多臂匪
3:有限马尔可夫决策过程
4:动态编程
5:蒙特卡洛方法
6:时差学习
7:n步自举
8:使用表格方法进行计划和学习
第二部分:近似解法
9:基于策略的预测
10:基于策略的近似控制
11:近似的非策略方法
12:资格跟踪
13:政策梯度法
第三节:深入了解
14:心理学
15:神经科学
16:应用和案例研究
17:边疆
【文件预览】:
reinforcement-main
----.gitignore(570B)
----README.md(995B)
----CH1.Rmd(1KB)