文件名称:tic_tac_toe
文件大小:46.84MB
文件格式:ZIP
更新时间:2024-04-09 08:05:23
Python
tic_tac_toe 这是一项正在进行的工作。 目标: 探索软件过程如何从基本原理中学到如何解决问题空间。这是受到启发。但是,AlphaZero的学习过程是不透明的,这并没有扩大我对软件如何学习问题空间的了解。这个项目是一个过程,人类可以通过该过程理解计算机从第一原理中学习的方式。 侧边栏: 人们不会通过以下任何方式来学习井字游戏,国际象棋或围棋之类的游戏: 详尽研究规则,策略和战术 详尽地研究过往大师的所有精彩游戏 他们实际上所做的是学习足够的知识以开始玩第一款游戏,然后随着游戏的进行进行学习。在玩早期游戏时,人类不会: 开始游戏时要考虑到可靠的策略(例如,西西里人的防守,鲁伊·洛佩兹等) 对所有可能的动作进行详尽,广度的优先搜索(即使在井字游戏中,NB也有9!或362,880个可能的动作) 计算任何给定举动的获胜/失败概率 探索过去玩过的精彩游戏的历史,寻找相似之处 该项目的目标是让