文件名称:Gridworld:Gridworld(强化学习)
文件大小:2.04MB
文件格式:ZIP
更新时间:2024-05-24 00:23:10
Java
网格世界 Gridworld(强化学习) 在攻读机器学习博士学位时,我出于教育目的实现了一些Java applet。 我创建了一个工具箱,学生可以在其中使用不同的强化学习算法。 强化学习是机器学习的一个分支,其重点在于从交互中学习。 强化学习可以看作是第一次执行任务时自动在人们的脑海中进行的学习过程。 与人类的行为类似,强化学习算法尝试不同的动作,并尝试建立包含所收集智慧的知识库。 随着时间的推移和尝试更多的动作,该算法对如何解决任务以及环境的动态如何影响这些动作有了很好的理解。 最后,该算法将收敛到可以从那时开始加以利用的最佳策略。 在此小程序中,我实现了: 可以添加和清除障碍物的交互式环境 具有不同奖励的不同目标位置 多样化的强化学习算法集,从Q学习,Q lambda,Sarsa 用户也可以 检查每一集的学习过程 在学习结束时 手动执行动作选择并检查影响 该应用的屏幕截图可以在