国际象棋-alpha-零:通过AlphaGo零方法进行国际象棋强化学习

时间:2024-02-27 10:32:02
【文件属性】:

文件名称:国际象棋-alpha-零:通过AlphaGo零方法进行国际象棋强化学习

文件大小:30.89MB

文件格式:ZIP

更新时间:2024-02-27 10:32:02

chess reinforcement-learning tensorflow keras alphago-zero

关于 通过方法进行棋类强化学习。 该项目基于以下主要资源: DeepMind于10月19日发布的文章: 。 @mokemokechicken在他的仓库中对DeepMind想法进行的伟大的Reversi开发: : DeepMind刚刚发布了新版本的AlphaGo Zero(现在称为AlphaZero),他们从零开始掌握国际象棋: ://arxiv.org/pdf/1712.01815.pdf。 事实上,在国际象棋中,仅4个小时(300k步)的AlphaZero跑赢了Stockfish哇! 有关更多详细信息,请参见 。 注意 我是此仓库的创建者。 我(和其他一些合作者尽了最大的努力:


【文件预览】:
chess-alpha-zero-master
----notebooks()
--------demo.ipynb(240KB)
----binder()
--------environment.yml(279B)
----LICENSE.txt(1KB)
----src()
--------__init__.py(0B)
--------chess_zero()
----requirements.txt(91B)
----model.png(475KB)
----data()
--------model()
----C0uci.bat(32B)
----.gitignore(199B)
----readme.md(8KB)

网友评论