文件名称:reinforcementlearningmario:该项目的目的是实施最先进的深度强化学习方法,即近距离策略优化(PPO),以培训代理人以完成超级马里奥兄弟世界第一的水平
文件大小:18.11MB
文件格式:ZIP
更新时间:2024-05-14 14:56:07
reinforcement-learning Python
超级马里奥兄弟的深度强化学习 描述 背景信息:超级马里奥兄弟(SMB)是一款流行的动作游戏,具有“真实的”环境和广阔的状态空间,是设计可玩计算机游戏的强化学习代理的理想平台。 该代理要求与世界上的各种对象和障碍进行交互,以鼓励采用知识丰富的学习方法。 方法-我们使用了OpenAI Gym提供的框架。 超级马里奥兄弟体育馆并从游戏环境中提取了信息,以使用PPO训练RL特工。 我们还向环境引入了预处理方法,例如帧缩放,随机跳帧,帧堆叠和噪声网,以提高代理的性能。 通过引入回滚操作来提高训练的稳定性,可以创建PPO的变体。 结果:该方法成功地训练了能够在20个小时的训练后完成水平的特工。 我们成功实现了一种方法,该方法可以比常规PPO实施更好地执行,在不应用数据预处理的情况下性能提高了50%,在应用数据预处理的情况下性能提高了10%。 工具 Pytorch已被用作主要的机器学习库 由于SMB
【文件预览】:
reinforcementlearningmario-master
----code()
--------preprocessing.py(5KB)
--------multiprocessing_env.py(5KB)
--------modelPPORBFinal2.pth(18.74MB)
--------ppo_rb.py(11KB)
--------readme.md(547B)
--------model.py(5KB)
----README.md(2KB)
----report()
--------report.md(1B)
--------report.pdf(683KB)
----mario.jpg(93KB)