文件名称:井字游戏使用强化学习
文件大小:194KB
文件格式:ZIP
更新时间:2024-03-04 18:36:21
JupyterNotebook
井字游戏使用强化学习 问题陈述 井字游戏是有史以来最受欢迎和最持久的游戏之一。 该游戏通常被用作数学分析决策过程的开始示例。 井字游戏有多种变体。 最经典的是X和O,每个玩家都希望将他们的三个标记放置在3x3网格的水平,垂直或对角线上。 该游戏的另一个流行变体是数字井字游戏。 使用数字1到9代替X和O。 在3x3网格中,数字1到9被填充,每个单元格中都有一个数字。 第一个玩家使用奇数游戏,第二个玩家使用偶数游戏,即玩家1只能在单元格中输入一个奇数,而玩家2可以在其余单元格中输入一个偶数。 每个数字在整个网格中只能使用一次。 在一行中放下15分的玩家(列,行或对角线)将赢得比赛。 游戏规则: 游戏将在3x3网格(9个单元)上使用1到9的数字进行游戏。每个数字在整个网格中只能使用一次。 有两个角色:一个是强化学习(RL)代理,另一个是环境。 RL代理被赋予奇数{1、3、5、7、9},
【文件预览】:
TicTacToe-Using-Reinforcement-Learning-main
----TCGame_Env.py(6KB)
----States_tracked.pkl(39KB)
----TicTacToe.png(14KB)
----README.md(2KB)
----TicTacToe_Agent.ipynb(754KB)