强化学习：专注于强化学习的相关概念，用例和学习方法下载

【文件属性】：

文件名称：强化学习：专注于强化学习的相关概念，用例和学习方法

文件大小：4KB

文件格式：ZIP

更新时间：2024-03-15 08:05:02

reinforcement-learning multi-armed-bandits exploration-exploitation

强化学习（RL）专注于强化学习的相关概念，用例和学习方法涵盖了RL中使用的关键术语，基本元素，围绕RL的概念/主题等。地区多武装强盗问题（MABP）有限马尔可夫决策过程（MDP）动态编程方法蒙特卡洛方法时差（TD）学习 n步自举表格解法和近似解法用例临床试验：临床试验期间患者的健康状况以及研究的实际结果极为重要。在这种情况下，探索等同于确定最佳治疗方法，而剥削则是在试验过程中尽可能有效地治疗患者。网络路由：路由是为网络中的流量（例如电话网络或计算机网络（互联网）等）选择路径的过程。可以将信道分配给正确的用户，以使总吞吐量最大化，可以表示为： MABP。在线广告：广告活动的目标是从展示广告中获得最大收益。每次网络用户单击要约时，广告商都会创收。与MABP相似，在探索（目标是使用点击率收集有关广告效果的信息）和利用（我们坚持至今效果最好的广告）之间要权

立即下载

【文件预览】：
ReinforcementLearning-main
----01_Introduction()
--------ReadMe.md(4KB)
----README.md(3KB)

秒客网

强化学习：专注于强化学习的相关概念，用例和学习方法

网友评论

相关文章