论文研究-优化深度确定性策略梯度算法.pdf下载

【文件属性】：

文件名称：论文研究-优化深度确定性策略梯度算法.pdf

文件大小：874KB

文件格式：PDF

更新时间：2022-09-30 20:35:59

论文研究

深度强化学习善于解决控制的优化问题，连续动作的控制因为精度的要求，动作的数量随着动作维度的增加呈指数型增长，难以用离散的动作来表示。基于Actor-Critic框架的深度确定性策略梯度（Deep Deterministic Policy Gradient，DDPG）算法虽然解决了连续动作控制问题，但是仍然存在采样方式缺乏科学理论指导、动作维度较高时的最优动作与非最优动作之间差距被忽视等问题。针对上述问题，提出一种基于DDPG算法的优化采样及精确评价的改进算法，并成功应用于选择顺应性装配机器臂（Selective Compliance Assembly Robot Arm，SCARA）的仿真环境中，与原始的DDPG算法对比，取得了良好的效果，实现了SCARA机器人快速自动定位。

立即下载

秒客网

论文研究-优化深度确定性策略梯度算法.pdf

网友评论

相关文章