文件名称:left-shift:使用深度强化学习解决游戏2048
文件大小:150.44MB
文件格式:ZIP
更新时间:2024-03-29 23:31:37
reinforcement-learning deep-reinforcement-learning 2048 deep-q-learning 2048-game
左移 该存储库包含我们的项目中ÉcolePolytechnique的INF581:AI高级主题中使用的代码。 在此项目中,我们旨在培训2048游戏的游戏代理。 我们实现了一个来对游戏进行建模,并使用来自稳定基线库的Deep Q-Learning(DQN)算法来训练多个代理,这些代理会改变状态编码,奖励功能,网络类型和结构。 结果表明,使用单热编码的编码状态对于提高性能至关重要。 我们还得出结论,就此游戏而言,卷积神经网络(CNN)比多层感知器(MLP)更有效。 要进行更深入的讨论,请阅读。 项目结构 下面我们详细介绍每个目录的功能: agents :包含用于训练和评估agent的脚本(有关Running子节的更多详细信息),以及实现自定义回调和策略的必要代码; docs :包含您在上面看到的GIF以及项目的最终报告; hyperparams :包含详细描述代理程序超参数的YAM
【文件预览】:
left-shift-master
----.gitignore(2KB)
----requirements-gpu.txt(71B)
----requirements.txt(67B)
----models()
--------cnn_5l_4_fc.zip(35.26MB)
--------cnn_alt_fc.zip(13.44MB)
--------cnn_5l.zip(2.49MB)
--------cnn_4l.zip(8.32MB)
--------cnn_2l.zip(9.7MB)
--------cnn_alt.zip(9.59MB)
--------cnn_5l_4_v2.zip(2.49MB)
--------cnn_3l.zip(8.76MB)
--------cnn_8l.zip(6.24MB)
--------cnn_6l.zip(6.34MB)
--------cnn_5l_1M.zip(8.04MB)
--------mlp.zip(10.08MB)
--------cnn_5l_nohot.zip(2.45MB)
--------cnn_5l_4_v2_nohot.zip(2.45MB)
--------cnn_5l_4.zip(13.7MB)
--------cnn_7l.zip(6.29MB)
--------mlp_nohot.zip(8.19MB)
----LICENSE(1KB)
----.gitmodules(95B)
----utils()
--------plot_log_multi.py(3KB)
--------plot_log.py(2KB)
----README.md(5KB)
----agents()
--------dqn.py(10KB)
--------ppo2.py(10KB)
--------play.py(402B)
--------random_agent.py(363B)
--------callback.py(9KB)
--------custom_policy.py(6KB)
----hyperparams()
--------dqn.yaml(253B)
--------ppo2.yaml(163B)
----docs()
--------2048.gif(6.78MB)
--------report.pdf(463KB)
----gym-text2048()
----logs()
--------cnn_alt.npz(510KB)
--------cnn_5l4.npz(582KB)
--------cnn_alt_fc.npz(580KB)
--------cnn_5l4_fc.npz(561KB)