matlab代码做游戏-Reinforcement-Learning:强化学习

时间:2024-06-10 06:12:25
【文件属性】:

文件名称:matlab代码做游戏-Reinforcement-Learning:强化学习

文件大小:45KB

文件格式:ZIP

更新时间:2024-06-10 06:12:25

系统开源

matlab代码做游戏rl_roadFighter 2017/18年度UEDIN强化学习课程的Matlab代码() 介绍: 该存储库中的代码受经典的80年代电脑游戏“ Road Fighter”()以及Benjamin Rosman和Subramanian Ramamoorthy(2010)题为“学习分层结构策略的游戏理论程序”的作品中介绍的类似应用程序的启发。 ()。 就像Road Fighter可能基于的旧模拟游戏()一样,您可以使用此工具集进行建模的Markov决策过程包括用户控制的“汽车”在地形上滑落,而后者被向下拉。 根据我们的定义,用户的目标是在对汽车造成最小损害的情况下达到关卡的尽头。 防止我们遭受此困扰的是未铺砌的地形和其他固定的汽车。 由于汽车始终处于行驶状态,因此用户在每个时间步长上的动作选择仅限于“左上”,“上”或“右上”。 过渡可能是随机的,因此用户将无法始终预测汽车的下一个位置,尽管这取决于汽车的当前状态和所采取的措施。 尽管原始游戏没有(可能)具有离散的时间和状态空间,但我们考虑的是一个网格世界,具有离散数量的行和列。 列从1开始,从左侧开始编号。 从地图的


【文件预览】:
Reinforcement-Learning-master
----screenOutput()
--------printAgentLocation.m(1KB)
--------printPointsOnGridMapWColors.m(2KB)
--------printAgentTrajectory.m(959B)
--------printCars.m(435B)
--------printGrid.m(729B)
--------refreshScreen.m(605B)
----README.md(7KB)
----startHere.m(6KB)
----defineMDP()
--------populateWithCars.m(1KB)
--------GridMap.m(9KB)
--------randomlyCreateATestGridMapFromMiniMapBlocks.m(897B)
--------miniMaps()
--------generateMiniMaps.m(980B)
--------generateRewardFunction.m(577B)
----test.m(9KB)
----exercise1.m(7KB)
----interactMDP()
--------actionMoveAgent.m(4KB)
--------setCurrentViewableGridMap.m(1KB)
----utilities()
--------randomWeightedSelect.m(676B)
----LICENSE(34KB)
----solution3.m(8KB)
----solution1.m(8KB)

网友评论