ddpg:使用深度确定性策略梯度进行连续控制下载

【文件属性】：

文件名称：ddpg:使用深度确定性策略梯度进行连续控制

文件大小：4.33MB

文件格式：ZIP

更新时间：2024-04-15 21:01:02

HTML

深度强化学习：持续控制介绍对于此项目，您将使用环境。在这种环境下，双臂可以移动到目标位置。对于代理人的手在目标位置中的每一步，将提供+0.1的奖励。因此，座席的目标是在尽可能多的时间步长中保持其在目标位置的位置。观察空间由33个变量组成，分别对应于手臂的位置，旋转，速度和角速度。每个动作是一个带有四个数字的矢量，对应于适用于两个关节的扭矩。动作向量中的每个条目都应为-1和1之间的数字。分布式培训对于此项目，我们将为您提供两个单独的Unity环境版本：第一个版本包含一个代理。第二个版本包含20个相同的代理，每个代理都有自己的环境副本。第二个版本对于，和类的算法很有用，这些算法使用同一代理的多个（非交互，并行）副本来分发收集经验的任务。解决环境选项1：解决第一个版本该任务是情节性的，并且为了解决环境，您的特工必须在100个连续情节中获得+30的平均

立即下载

【文件预览】：
ddpg-master
----REPORT.md(2KB)
----agent.py(8KB)
----reacher.gif(3.98MB)
----Continuous_Control.ipynb(28KB)
----checkpoint_actor.pth(153KB)
----scores.png(12KB)
----LICENSE(1KB)
----Continuous_Control.html(311KB)
----model.py(2KB)
----workspace_utils.py(2KB)
----README.md(5KB)
----checkpoint_critic.pth(154KB)

秒客网

ddpg:使用深度确定性策略梯度进行连续控制

网友评论

相关文章