MuGo:以可读的方式复制AlphaGo的体系结构

时间:2024-05-03 04:36:33
【文件属性】:

文件名称:MuGo:以可读的方式复制AlphaGo的体系结构

文件大小:5.22MB

文件格式:ZIP

更新时间:2024-05-03 04:36:33

Python

更新 截至2017年中期,此回购已被放弃。 上的代码是此处工作的延续。 MuGo:模仿AlphaGo的极简Go引擎 这是AlphaGo基本部分的纯Python实现。 AlphaGo本身的逻辑/控制流程不是很复杂,在此进行复制。 AlphaGo的秘密之处在于其各种神经网络。 (据我了解)AlphaGo在游戏过程中使用了三个神经网络。 第一个NN是一个缓慢但准确的策略网络。 该网络经过训练可以预测人类的举动(准确度约为57%),并输出合理的举动列表,每个举动都附带有概率。 该第一个NN用于通​​过合理的动作为Monte Carlo树搜索提供种子。 第一个NN速度慢的原因之一是它的大小,以及神经网络的输入是Go板的各种昂贵的计算属性(*计数,ataris,梯形状态等)。 第二个NN是一个更小,更快,但准确性较低(约24%准确性)的策略网络,并且不使用计算的属性作为输入。 到达当前MCTS树


【文件预览】:
MuGo-master
----load_data_sets.py(6KB)
----misc()
--------exploding_activations.png(104KB)
----go.py(14KB)
----main.py(4KB)
----sgf_wrapper.py(5KB)
----utils.py(2KB)
----features.py(4KB)
----tests()
--------test_utils.py(4KB)
--------test_go.py(18KB)
--------test_sgf_wrapper.py(6KB)
--------test_strategies.py(980B)
--------test_features.py(3KB)
--------test_datasets.py(2KB)
--------example_game.sgf(804B)
----LICENSE(11KB)
----policy.py(10KB)
----requirements.txt(99B)
----.gitignore(28B)
----papers()
--------alphago_policy_dcnn2015.pdf(496KB)
--------facebook2015.pdf(1.59MB)
--------alphago2016.pdf(2.56MB)
--------clark15.pdf(304KB)
--------2013-mcts-go-limits-experiments.zip(1.65MB)
----README.md(5KB)
----strategies.py(10KB)

网友评论