立体四子棋的深度学习算法实践2

时间:2022-03-06 02:26:24
【文件属性】:

文件名称:立体四子棋的深度学习算法实践2

文件大小:1.95MB

文件格式:ZIP

更新时间:2022-03-06 02:26:24

立体四子棋 深度学习 强化学习 alphazero 蒙特卡洛树

参考资料,https://zhuanlan.zhihu.com/p/32089487,本实现参考借鉴了该资源,本实现的立体四子棋为落子有限制版的立体四子棋(qubic),必须先下下层的棋子,上层的相关棋子才能继续落子,经过3500次的训练,ai水平基本可以了,模型为best_policy.model,python human_play.py即可对战。训练使用python train.py. python版本2


【文件预览】:
AlphaZero_Qubic-master1
----.gitignore(19B)
----mcts_alphaZero.py(8KB)
----mcts_pure.py(7KB)
----best_policy.model(931KB)
----LICENSE(1KB)
----game.pyc(11KB)
----policy_value_net_numpy.py(4KB)
----policy_value_net.py(5KB)
----policy_value_net_keras.py(5KB)
----policy_value_net_pytorch.py(6KB)
----playout400.gif(21KB)
----current_policy.model(931KB)
----README.md(3KB)
----mcts_pure.pyc(9KB)
----policy_value_net_tensorflow.py(7KB)
----policy_value_net.pyc(5KB)
----policy_value_net_numpy.pyc(5KB)
----mcts_alphaZero.pyc(9KB)
----human_play.py(3KB)
----game.py(12KB)
----train.py(9KB)

网友评论