文件名称:nim-MCTS:蒙特卡洛树搜索,树的置信度上限 (UCT) for Nim
文件大小:9KB
文件格式:ZIP
更新时间:2024-07-29 03:34:19
Nim
nim-MCTS 蒙特卡洛树搜索,树的置信度上限 (UCT) for Nim UCT 以随机方式搜索好的移动。 每次迭代分为三个阶段: 按照上置信度 (UCT) 顺序,沿着尝试过的动作树向下走,直到找到未尝试过的动作。 当发现未尝试的移动时,通过随机移动来玩游戏。 游戏结束后,回到树上,更新上置信度 (UCT)。 该算法将首先探索未尝试过的走法,然后是对于选择走法的任何玩家来说看起来有希望的走法。 UCT 被评估为 wins/visits + UCTK*sqrt(2*log(visits)/visits) UCTK 是一些常数,它将调整探索与利用。 更高的常数将倾向于更多的探索(接近无穷大,它将选择最少访问的节点),而零值将简单地选择当前最好的节点。 我还添加了一个选项来运行启发式搜索。 TODO - 阅读文献,并找到一个很好的方法来做到这一点。 使用非常简单的启发式方
【文件预览】:
nim-MCTS-master
----.gitignore(41B)
----README.md(2KB)
----examples()
--------OXO.nim(2KB)
--------Othello.nim(5KB)
----LICENSE(2KB)
----nimMCTS.nim(10KB)
----nimMCTS.babel(334B)