snake.ai:AI多人蛇

时间:2024-05-20 16:46:36
【文件属性】:

文件名称:snake.ai:AI多人蛇

文件大小:70KB

文件格式:ZIP

更新时间:2024-05-20 16:46:36

machine-learning reinforcement-learning ai snake-game adversarial-search

snake.ai-多人蛇AI 该项目提供 一个由蛇游戏的 基于强化学习(Q学习,策略梯度)和博弈论(对抗搜索,例如Minimax,Alpha-beta修剪...)的各种代理的实现 该游戏的多主体性质为探索RL算法(例如课程学习,训练过程中的对手如何影响学习的行为等)提供了无尽的机会,也是评估每种方法的相对性能的好方法。 此外,还可以研究不同的奖励功能或游戏规则将如何塑造代理商的策略:例如,最好是通过吃糖果尽可能多地成长,或者尝试杀死其他玩家以结束游戏,尽快 阅读以获得该项目的概述,以及有关已实施的一种强化学习方法(通过神经网络进行函数逼近的Q学习)的一些详细信息。 可视化单个游戏 可以通过以下命令使用GUI运行单个游戏 $ python controller.py [h] 如果确实使用选项h ,则会添加一个“人类玩家”:您可以使用键盘控制的代理。 配置文件 配置文件config.py可让


【文件预览】:
snake.ai-master
----features.py(7KB)
----.gitignore(128B)
----interface.py(15KB)
----snake.py(9KB)
----info()
--------.keep(0B)
----es.py(6KB)
----controller.py(5KB)
----data()
--------simple-ql-r6.p(15KB)
--------simple.p(15KB)
--------rl-ql-linear-r6-1000.p(15KB)
--------rl-pg-linear-r6-1000.p(22KB)
--------simple-pg-r6.p(22KB)
----minimax.py(14KB)
----experiments()
--------.keep(0B)
----rl_interface.py(4KB)
----LICENSE(1KB)
----agent.py(850B)
----qlearning.py(11KB)
----constants.py(901B)
----move.py(581B)
----strategies.py(2KB)
----utils.py(2KB)
----README.md(4KB)
----config.py(980B)
----simulation.py(5KB)
----policy_gradients.py(6KB)
----gui.py(3KB)
----hp.py(1KB)
----rl.py(3KB)

网友评论