tmlp:Teeworlds机器学习项目-A2C Python实现

时间:2024-06-10 23:32:20
【文件属性】:

文件名称:tmlp:Teeworlds机器学习项目-A2C Python实现

文件大小:14KB

文件格式:ZIP

更新时间:2024-06-10 23:32:20

Python

Teeworlds机器学习项目的任务是教AI玩2D平台游戏/射击游戏。 该存储库在teeworlds-tmlp子模块中包含Teeworlds游戏服务器的修改版本,并在a2c.py中使用该游戏服务器来实现A2C强化学习算法。 该模型未实现显着性能。 它开始采取完全概率性的行动,并学会了防止自己自杀,这可能是在地面射击造成的。 它没有学会与对手战斗。 可能有很多原因: 我有一些关于A2C中主要训练循环的最新实现方式以及基于状态的RNN的具体问题,我没有时间来寻找答案。 因此,我只是以我认为合理的方式实施了该功能,但其中的一些小细节可能是关键因素。 我几乎没有做过超参数调整或网格搜索。 将输入空间和操作空间呈现给网络的方式可能不是最佳的。 可能有一个错误。 强化学习可能无法解决此问题。 如果您想从事这个项目,我将很高兴与您合作。 关于A2C / PPO / A3C的实现,大部分


【文件预览】:
tmlp-master
----.gitignore(74B)
----README.md(3KB)
----teeworlds-tmlp()
----old_nn.py(10KB)
----.gitmodules(101B)
----a2c.py(12KB)
----storage.cfg(40B)
----render_video.py(3KB)
----copy-tensorflow-headers(1KB)
----ckpt_to_savedmodel.py(259B)
----TODO(951B)
----inspect-model(91B)
----autoexec.cfg(138B)
----LICENSE.txt(1KB)

网友评论