文件名称:算法的具体步骤-蒙特卡罗围棋搜索
文件大小:1.24MB
文件格式:PPT
更新时间:2024-05-16 04:57:33
蒙特卡罗树 蒙特卡罗搜索
算法的具体步骤 1. 由当前局面建立根节点,生成根节点的全部子节点,分别进行模拟对局; 2. 从根节点开始,进行最佳优先搜索; 3. 利用UCB公式计算每个子节点的UCB值,选择最大值的子节点; 4. 若此节点不是叶节点,则以此节点作为根节点,重复2; 5. 直到遇到叶节点,如果叶节点未曾经被模拟对局过,对这个叶节点模拟对局;否则为这个叶节点生成子节点,并进行模拟对局; 6. 将模拟对局的收益(一般胜为1负为0)按对应颜色更新该节点及各级祖先节点,同时增加该节点以上所有节点的访问次数; 7. 回到2,除非搜索时间结束或者达到预设循环次数; 8. 从当前局面子节点中挑选平均收益最高的给出最佳着法。