slimevolleygym:用于单人和多人强化学习的简单OpenAI Gym环境

时间:2021-03-18 17:03:01
【文件属性】:
文件名称:slimevolleygym:用于单人和多人强化学习的简单OpenAI Gym环境
文件大小:6.56MB
文件格式:ZIP
更新时间:2021-03-18 17:03:01
Python 史莱姆排球体育馆环境 史莱姆排球是由一位不知名的作家在2000年代初期创建的游戏。 “游戏的物理原理有点'狡猾',但其简单的游戏玩法却立即使人上瘾。” SlimeVolleyGym是一个简单的健身房环境,用于测试单人和多人强化学习算法。 游戏非常简单:代理人的目标是使球着陆在对手方的地面上,从而使对手丧生。每个特工从五个生命开始。当任何一个特工失去全部五个生命时,或者经过3000个时间步长后,情节结束。座席失去对手时会获得+1的奖励,而失去生命则会获得-1的奖励。 该环境基于我于创建JavaScript游戏 ,该游戏使用自我玩耍和进化来训练简单的神经网络代理,以使游戏比大多数人类玩家玩得更好。我决定将其作为轻量级的快速健身房环境移植到Python,作为更高级的RL方法(例如多主体,自玩,持续学习和模仿学习算法)的测试平台。 显着特点 只有依赖项是Gym和numpy。不需要其他库来运行e
【文件预览】:
slimevolleygym-master
----training_scripts()
--------train_ppo_pixel.py(3KB)
--------train_ppo_mpi.py(2KB)
--------train_ga_selfplay.py(3KB)
--------train_ppo_selfplay.py(4KB)
--------train_ppo.py(1KB)
----TRAINING.md(19KB)
----test_state.py(3KB)
----eval_agents.py(6KB)
----eval_ppo_pixel.py(2KB)
----LICENSE(11KB)
----eval_ppo.py(5KB)
----zoo()
--------cmaes_sp()
--------ga_sp()
--------ppo_cnn()
--------cmaes()
--------ppo()
--------ppo_sp()
----setup.py(390B)
----figure()
--------sp_results.svg(60KB)
--------cmaes_results.svg(42KB)
--------mpi_ppo_results.svg(51KB)
--------ppo_results.svg(645KB)
--------cmaes_sp_results.svg(38KB)
--------ga_results.svg(125KB)
----slimevolleygym()
--------mlp.py(5KB)
--------slimevolley.py(34KB)
--------__init__.py(101B)
----README.md(12KB)
----test_pixel.py(2KB)
----test_atari.py(6KB)

网友评论