蒙特卡洛树搜索:以编程语言Julia实现一个版本的蒙特卡洛树搜索并显示结果树

时间:2024-03-17 22:33:36
【文件属性】:

文件名称:蒙特卡洛树搜索:以编程语言Julia实现一个版本的蒙特卡洛树搜索并显示结果树

文件大小:3KB

文件格式:ZIP

更新时间:2024-03-17 22:33:36

Julia

蒙特卡洛树搜索 用编程语言Julia实现一个版本的Monte Carlo Tree Search,并显示结果树。 对于第一次迭代,我们从节点[19,19]开始并列出其所有动作。 由于未采取任何措施,因此所有这些措施的UCB分数均为无穷大。 在接下来的四次迭代中,算法将这些动作一个接一个地执行,生成一个子动作,列出该子动作的所有动作,从该子动作中展开,最后将该值传播回[19,19]的每个动作。 政策的推出始终是:正确。 因此,([[19,19],:: up)状态动作对具有最高的Q值,即从[19,19]上升到右移达到终端状态。 对于第六次迭代,选择了[[19,19],:: up),因为它的UCB分数很高,并从中生成了子级[19,20]。 由于已经列出了[19,20]的动作,所有动作均具有无限的UCB分数,因此该算法花费第六次和第七次迭代尝试其中两个动作(:down和:right,仅是因为它们


【文件预览】:
Monte-Carlo-Tree-Search-main
----MCTS.jl(3KB)
----README.md(2KB)

网友评论