rl-resources:精选的强化学习资源

时间:2024-06-12 03:25:19
【文件属性】:

文件名称:rl-resources:精选的强化学习资源

文件大小:289.99MB

文件格式:ZIP

更新时间:2024-06-12 03:25:19

reinforcement-learning

强化学习资源 我个人的强化学习资源集合。 如果您喜欢这种方法,请查看 ,和 。 大多数内容位于主题文件夹中,例如alphago和model-based 。 以下是针对强化学习新手的建议和推荐资源。 教科书和课程 -期待已久的第二版于2019年发布 UCL讲座-David Silver(DeepMind强化学习负责人)- 深度强化学习中的开放式AI旋转-- 入门编码 要训​​练强化学习代理,您需要三件事-一个环境(参阅 ),一个代理和运行实验的代码。 学习如何使用强化学习的一部分是逐渐了解代理应该在玩具环境中学习的速度。 三个有用的环境是: -离散动作空间 -连续动作空间 困难的勘探问题 开始构建简单的代理程序和代码以运行实验。 下面列出了要处理的代理程序: 动态编程 交叉熵法 DQN 加强 PPO SAC 不要同时建立环境和代理! 您不确定调试时问题出在哪里。 对多个随机种子


网友评论