逆向深度q学习

时间:2024-03-04 23:24:32
【文件属性】:

文件名称:逆向深度q学习

文件大小:8KB

文件格式:ZIP

更新时间:2024-03-04 23:24:32

Python

创建三个玩Reversi游戏的AI代理(也称为商标Othello)。 由python撰写 game_play.py 该文件将播放两个AI代理。 从命令行,使用以下命令调用此函数: python gameplay.py [-t ] [-v] [-r] player1 player2 其中player1.py和player2.py是包含nextMove和nextMoveR的python文件。 标志-v代表详细输出(每转之后显示板,已经实现),标志-r代表“反转”(使用nextMoveR而不是nextMove)。 random_play.py 主动采取法律行动的AI代理 simple_greedy.py 使用脑死亡评估功能,无需搜索的AI代理 min_max.py 使用minmax搜索和alpha-beta修剪的AI代理 例如,您可以让两个随机的玩家互相对抗: python3 ga


【文件预览】:
reversi-deep-q-learning-master
----.gitignore(3KB)
----gameplay.py(8KB)
----random_play.py(422B)
----q_learn.py(0B)
----README.md(1KB)
----greedy.py(1KB)
----min_max.py(4KB)
----.gitattributes(483B)
----feeder.py(2KB)

网友评论