connect4-alpha-zero:通过AlphaGo零方法进行Connect4强化学习

时间:2024-05-21 11:16:05
【文件属性】:

文件名称:connect4-alpha-zero:通过AlphaGo零方法进行Connect4强化学习

文件大小:2.18MB

文件格式:ZIP

更新时间:2024-05-21 11:16:05

reinforcement-learning tensorflow keras connect4 alphago-zero

关于 通过方法进行Connect4强化学习。 该项目基于两个主要资源: DeepMind的10月19日发行的出版物: 。 @mokemokechicken在他的仓库中对DeepMind想法进行的伟大的Reversi开发: : 环境 的Python 3.6.3 张量流gpu:1.3.0 凯拉斯:2.0.8 模组 强化学习 此AlphaGo零实现由三个worker self , opt和eval 。 self是Self-Play,可以使用BestModel通过自我播放来生成训练数据。 opt是Trainer来训练模型并生成下一代模型。 eval是评估者,用于评估下一代模型是否优于BestModel。 如果更好,请替换BestModel。 评估 为了进行评估,您可以使用BestModel下棋。 play_gui是使用ASCII字符编码的Play Game vs BestMo


【文件预览】:
connect4-alpha-zero-master
----readme.md(4KB)
----data()
--------model()
----src()
--------connect4_zero()
--------__init__.py(0B)
----requirements.txt(954B)
----.gitignore(199B)
----LICENSE.txt(1KB)

网友评论