文件名称:alphazero-hex:为Hex实现的AlphaZero
文件大小:23.16MB
文件格式:ZIP
更新时间:2024-05-30 12:24:31
JupyterNotebook
在这里阅读更多: : 训练神经网络 hex_zero_model.py包含用于策略和价值预测的深度神经网络的构建。 sl_bootstrap.py包含一个脚本,用于在现有的十六进制数据上引导神经网络,并在训练神经网络以指定时间段之前,调用hex_zero_model来构建神经网络。 指示 python3 sl_bootstrap.py 对各种玩家进行评估 Hex.py包含用于与不同玩家(Self,Random,HexPlayerBryce)对战的几个功能,您可以在其中指定游戏数量和玩家1,以及是否轮流展示游戏。 指示 python3 Hex.py AlphaHex代理 AlphaHex.py包含使用常规AlphaZero算法的实际代理。 自我游戏与强化学习 TrainAlphaHexZero.py包含一个脚本,可以自播放指定数量的迭代。 在每次迭代中,AlphaHex代理都会针对自
【文件预览】:
alphazero-hex-master
----hex_data.npz(23.25MB)
----hex_data.ipynb(54KB)
----TestAlphaHex.py(8KB)
----BasicPlayers.py(988B)
----hex_zero_model.py(3KB)
----README.md(2KB)
----Hex.py(7KB)
----sl_bootstrap.py(2KB)
----TrainAlphaHexZero.py(5KB)
----BackupAlphaHex.py(6KB)
----AlphaHex.py(10KB)