文件名称:matlab代码做游戏-UoE-reinforcement-learning:UoE强化学习
文件大小:1.01MB
文件格式:ZIP
更新时间:2024-06-10 06:12:28
系统开源
matlab代码做游戏rl_roadFighter 2017/18年度UEDIN强化学习课程的Matlab代码() 介绍: 该存储库中的代码受经典的80年代电脑游戏“ Road Fighter”()以及Benjamin Rosman和Subramanian Ramamoorthy(2010)题为“学习分层结构策略的游戏理论程序”的作品中介绍的类似应用程序的启发。 ()。 就像Road Fighter可能基于的旧模拟游戏()一样,您可以使用此工具集进行建模的Markov决策过程包括用户控制的“汽车”在地形上滑落,而后者被向下拉。 根据我们的定义,用户的目标是在对汽车造成最小损害的情况下达到关卡的尽头。 防止我们遭受此困扰的是未铺砌的地形和其他固定的汽车。 由于汽车始终处于行驶状态,因此用户在每个时间步长上的动作选择仅限于“左上”,“上”或“右上”。 过渡可能是随机的,因此用户将无法始终预测汽车的下一个位置,尽管这取决于汽车的当前状态和所采取的措施。 尽管原始游戏没有(可能)具有离散的时间和状态空间,但我们考虑的是一个网格世界,具有离散数量的行和列。 列从1开始,从左侧开始编号。 从地图的
【文件预览】:
UoE-reinforcement-learning-master
----.ipynb_checkpoints()
--------Untitled-checkpoint.ipynb(72B)
--------Open AI Gym Blackjack-checkpoint.ipynb(252KB)
--------MC Control with Epsilon-Greedy Policies Solution.ipynb-checkpoint.txt(252KB)
----utilities()
--------randomWeightedSelect.m(676B)
----RL_coursework1.pdf(675KB)
----interactMDP()
--------actionMoveAgent.m(4KB)
--------setCurrentViewableGridMap.m(1KB)
----RL_coursework2.pdf(851KB)
----Untitled.ipynb(1KB)
----coursework1_solution()
--------report.txt(2KB)
--------policyEvaluation.m(2KB)
--------printTrajectory.m(2KB)
--------exercise3.m(5KB)
--------policyIteration.m(2KB)
--------exercise3_output.png(35KB)
--------exercise1.m(4KB)
----LICENSE(34KB)
----README.md(7KB)
----defineMDP()
--------generateMap.m(1KB)
--------generateRewardFunction.m(577B)
--------miniMaps()
--------GridMap.m(10KB)
--------generateMiniMaps.m(980B)
--------populateWithCars.m(1KB)
--------randomlyCreateATestGridMapFromMiniMapBlocks.m(897B)
----Open AI Gym Blackjack.ipynb(279KB)
----screenOutput()
--------printGrid.m(729B)
--------printAgentLocation.m(1KB)
--------printPointsOnGridMapWColors.m(2KB)
--------printCars.m(435B)
--------refreshScreen.m(605B)
--------printAgentTrajectory.m(961B)
----coursework2_solution()
--------cw2_solution1.m(6KB)
--------writeup.txt(2KB)
--------cw2_solution2.m(8KB)
----startHere.m(6KB)