文件名称:MonteCarloTreeSearch:该项目将蒙特卡洛树搜索(MCTS)应用于简单的网格世界
文件大小:8KB
文件格式:ZIP
更新时间:2024-06-05 05:42:26
Python
蒙特卡罗树搜索 介绍 该项目将蒙特卡洛树搜索(MCTS)应用于简单的网格世界。 我们使用树的上置信界(UCT)算法。 UCT是最流行的MCTS算法。 该实现基于“ 。 环境 我们将MCTS应用于FrozenLake环境的确定性变体。 在这种环境中,代理程序从S开始,目标是移动到G。代理程序可以在冻结的表面F上行走,并且需要避开KongH: 。 代理可以采取4种可能的措施: 0 left 1 down 2 right 3 up 例子 如果我们处于状态0并向左移动(动作= 0),我们将再次进入状态0。 树策略将新状态0添加到旧状态0。默认策略使用新状态来模拟奖励。 模拟返回的奖励为0: 0: (action=None, visits=1, reward=0, ratio=0.0000) └── 0: (action=0, visits=1, reward=0, ratio=0.0
【文件预览】:
MonteCarloTreeSearch-master
----images()
--------grid_states.png(4KB)
----utilities()
--------node.py(1KB)
--------tree.py(3KB)
----run_mcts.py(855B)
----model.py(3KB)
----.gitignore(24B)
----README.md(2KB)