文件名称:超级马里奥兄弟的近距离策略优化(PPO)算法-Python开发
文件大小:182.32MB
文件格式:ZIP
更新时间:2024-06-14 11:26:45
Python Deep Learning
这是我的python源代码,用于训练特工玩超级马里奥兄弟。 通过使用近端策略优化算法论文中介绍的近端策略优化(PPO)算法。 [PYTORCH]用于玩超级马里奥兄弟的近战策略优化(PPO)简介这是我的python源代码,用于训练特工玩超级马里奥兄弟。 通过使用近端策略优化算法论文中介绍的近端策略优化(PPO)算法。 说到性能,我经过PPO培训的代理可以完成29/32个级别,这比我一开始的预期要好得多。 供您参考,PPO是OpenAI提出并使用的算法