超级马里奥兄弟的近距离策略优化(PPO)算法-Python开发

时间:2024-06-14 11:26:45
【文件属性】:

文件名称:超级马里奥兄弟的近距离策略优化(PPO)算法-Python开发

文件大小:182.32MB

文件格式:ZIP

更新时间:2024-06-14 11:26:45

Python Deep Learning

这是我的python源代码,用于训练特工玩超级马里奥兄弟。 通过使用近端策略优化算法论文中介绍的近端策略优化(PPO)算法。 [PYTORCH]用于玩超级马里奥兄弟的近战策略优化(PPO)简介这是我的python源代码,用于训练特工玩超级马里奥兄弟。 通过使用近端策略优化算法论文中介绍的近端策略优化(PPO)算法。 说到性能,我经过PPO培训的代理可以完成29/32个级别,这比我一开始的预期要好得多。 供您参考,PPO是OpenAI提出并使用的算法


网友评论