【文件属性】:
文件名称:Orbit:强化学习环境的开源合集
文件大小:1.93MB
文件格式:ZIP
更新时间:2021-05-06 11:12:47
reinforcement-learning deep-learning game-development reinforcement-learning-environments Python
轨道
Orbit是一个开源项目,是强化学习环境的集合。 如果您想通过创建自己的环境为该项目做出贡献,请发送电子邮件至 。 您可以通过博客了解如何创建环境:
要求
python - 3.7
keras - 2.4.3
tensorflow - 2.2.0
检出random_policy.py以查看如何使用环境。
截至目前,Orbit包含以下RL环境。
环境1:桨
作者:
任务是将球接在桨上。 内置的turtle库用于创建环境。
动作空间(3)
0向左移动拨片
1什么也不做
2向右移动拨片
州际空间(5)
x桨的位置
球的x和y位置
球的x和y速度
奖励功能
+3.0球拍击球时
-3.0球触地时
-0.1桨移动时
剧集终止
当球碰到地面时,情节结束。
环境2:跳
作者:
躲避移动球中的袋鼠的任务。 内置的turtle库用于创建环境。
动作空间(2)
0跳
1什么也不做
州
【文件预览】:
Orbit-master
----Jump()
--------assets()
--------jump.py(6KB)
--------wall.gif(563KB)
----Cannon()
--------cannon.py(5KB)
--------assets()
--------wall.gif(1.34MB)
----LICENSE(1KB)
----README.md(2KB)
----random_policy.py(815B)
----.gitignore(87B)
----Paddle()
--------reward_plot.png(27KB)
--------DQN_agent.py(3KB)
--------wall.gif(269KB)
--------paddle.py(4KB)