强化:与Sutton&Barto教科书相关的完整章节练习:强化学习-简介

时间:2024-03-23 11:12:16
【文件属性】:

文件名称:强化:与Sutton&Barto教科书相关的完整章节练习:强化学习-简介

文件大小:2KB

文件格式:ZIP

更新时间:2024-03-23 11:12:16

Sutton&Barto撰写的《强化学习:简介》 (第2版)包括本章练习。 该资料库存储了我在理解强化学习过程中对这些练习的尝试。 所有练习均在Rmarkdown中完成,并按章节分开。 章节: 1:简介 第一部分:表格求解方法 2:多臂匪 3:有限马尔可夫决策过程 4:动态编程 5:蒙特卡洛方法 6:时差学习 7:n步自举 8:使用表格方法进行计划和学习 第二部分:近似解法 9:基于策略的预测 10:基于策略的近似控制 11:近似的非策略方法 12:资格跟踪 13:政策梯度法 第三节:深入了解 14:心理学 15:神经科学 16:应用和案例研究 17:边疆


【文件预览】:
reinforcement-main
----.gitignore(570B)
----README.md(995B)
----CH1.Rmd(1KB)

网友评论