文件名称:强化学习领域的课程学习:一个框架和综述.pdf
文件大小:1.52MB
文件格式:PDF
更新时间:2023-04-12 11:03:12
RL
强化学习(RL)是一种流行的处理顺序决策任务的范式,其中agent只有有限的环境反馈。尽管在过去的三十年里取得了许多进步,但是在许多领域的学习仍然需要大量的与环境的交互,这在现实的场景中是非常昂贵的。为了解决这个问题,迁移学习被应用于强化学习,这样在一个任务中获得的经验可以在开始学习下一个更困难的任务时得到利用。
文件名称:强化学习领域的课程学习:一个框架和综述.pdf
文件大小:1.52MB
文件格式:PDF
更新时间:2023-04-12 11:03:12
RL
强化学习(RL)是一种流行的处理顺序决策任务的范式,其中agent只有有限的环境反馈。尽管在过去的三十年里取得了许多进步,但是在许多领域的学习仍然需要大量的与环境的交互,这在现实的场景中是非常昂贵的。为了解决这个问题,迁移学习被应用于强化学习,这样在一个任务中获得的经验可以在开始学习下一个更困难的任务时得到利用。