文件名称:procgen:Procgen基准测试
文件大小:31.32MB
文件格式:ZIP
更新时间:2024-06-01 04:07:41
C++
状态:维护(预计错误修复和次要更新) Procgen基准测试 16个易于使用的程序生成的环境,可以直接衡量强化学习代理学习通用技能的速度。 这些环境在单个内核上高速运行(每秒数千步)。 我们目前正在开展一项竞赛,该竞赛使用这些环境来评估RL中的样本效率和一般性。 您可以了解更多信息并进行注册。 这些环境与论文《。 这篇论文中进行一些实验的代码在 repo中。 对于熟悉原始,请确保阅读以下更新的CoinRun说明,因为对环境进行了细微的更改。 与相比,这些环境是: 更快:Gym Retro环境已经快了,但是Procgen环境的运行速度快了4倍。 随机化:“健身房复古”环境始终是相同的,因此您可以记住一系列动作,这些动作将获得最高的回报。 Procgen环境是随机的,因此这是不可能的。 可自定义:如果从源代码安装,则可以在更改环境或构建自己的环境的地方执行实验。 每个环境的特定于