drl_p2_continuous-control

时间:2024-04-02 00:45:14
【文件属性】:

文件名称:drl_p2_continuous-control

文件大小:471KB

文件格式:ZIP

更新时间:2024-04-02 00:45:14

JupyterNotebook

drl_p2_continuous-control 该存储库的内容表示“ Udacity深度强化学习”课程的项目2。 在此项目中,我们正在解决由控制双关节手臂的运动组成的触手环境。 通过在此双关节臂上执行操作,我们可以了解最佳控制策略。 为了执行此训练,我们使用深度确定性策略梯度(DDPG)算法。 我们在多主体情况下解决该算法,目标是使用20个主体,至少连续100次情节维持+30的奖励。 可以通过打开笔记本的Continuous_Control.ipynb并运行所有单元格来运行代码。 多代理到达环境 Reacher环境由多个机器人手臂的控制组成。 每个代理的观察空间大小为33,描述了机械臂的位置,旋转,速度和角速度。 作用空间大小为四,代表两个关节上的扭矩。 参考:


【文件预览】:
drl_p2_continuous-control-main
----checkpoint_actor.pth(151KB)
----ddpg_agent.py(8KB)
----checkpoint_critic.pth(425KB)
----Report.md(2KB)
----model.py(3KB)
----Continuous_Control.ipynb(24KB)
----README.md(1KB)
----workspace_utils.py(2KB)

网友评论