文件名称:agogo:Go中AlphaGo的重新实现(特别是AlphaZero)
文件大小:99KB
文件格式:ZIP
更新时间:2024-05-30 23:41:54
Go
阿戈戈 Go中AlphaGo的重新实现(特别是AlphaZero) 关于 该算法包括: 在软件包中实现的蒙特卡洛树搜索(MCTS); 在软件包中实现的Dual Neural Network(DNN)。 该算法被包装到顶层结构(AlphaZero的 )中。 该算法适用于能够履行指定合同的任何游戏。 合同指定游戏状态的描述。 在此程序包中,合同是在game程序包声明的Go接口。 一些概念/通用语言的描述 在agogo包中,游戏的每个玩家都是一个 ,在game ,两个Agents正在一个中玩 该game程序包与AlphaZero算法松散地耦合在一起,并描述了游戏的行为(而不是游戏是什么)。 该行为表示为在游戏下进行操作的一组功能。 状态是代表当前游戏状态以及允许的交互的接口。 交互是由操作的对象进行的。 实施者的责任是通过创建满足国家合同并实施允许的移动的对象来编码游戏规则。 培训过程
【文件预览】:
agogo-master
----.gitignore(275B)
----go.mod(555B)
----utils.go(977B)
----statistics.go(1KB)
----dummy.go(482B)
----agogo.go(7KB)
----datatypes.go(2KB)
----agent.go(2KB)
----naughty.go(409B)
----LICENSE(1KB)
----go.sum(21KB)
----const_nocuda.go(104B)
----README.md(7KB)
----encoding_helper.go(2KB)
----deploy()
--------cluster-down.sh(237B)
--------k8s_nodes.yaml(384B)
--------componenttester()
--------bootstrap-model.sh(390B)
--------vars.sh(471B)
--------k8s_master.yaml(377B)
--------k8s_cluster.yaml(924B)
--------cluster-up.sh(1KB)
--------selfplay()
--------README.md(1KB)
--------unset-vars.sh(267B)
--------utils.sh(130B)
----const_cuda.go(48B)
----game()
--------utils.go(147B)
--------mnk()
--------asciirender.go(3KB)
--------naughty.go(419B)
--------state.go(5KB)
--------c4()
--------komi()
--------wq()
--------pool.go(983B)
----encoding_helper_test.go(1KB)
----mcts()
--------mcts.go(953B)
--------utils.go(2KB)
--------release.go(288B)
--------debug.go(635B)
--------unsafe.go(184B)
--------node.go(8KB)
--------naughty.go(147B)
--------search.go(14KB)
--------unsafe_test.go(456B)
--------tree.go(7KB)
--------example_test.go(4KB)
--------unsafe_unsafe.go(314B)
--------unsafe_safe.go(379B)
--------graph.go(2KB)
----pool.go(983B)
----dualnet()
--------utils.go(976B)
--------ermahagerdmonards.go(4KB)
--------config_test.go(529B)
--------dual_test.go(5KB)
--------meta.go(5KB)
--------dual.go(5KB)
--------config.go(1KB)
----arena.go(5KB)
----cmd()
--------tictactoe()
----internal()
--------online()
--------gtp()