论文研究-基于动态融合目标的深度强化学习算法研究.pdf下载

【文件属性】：

文件名称：论文研究-基于动态融合目标的深度强化学习算法研究.pdf

文件大小：963KB

文件格式：PDF

更新时间：2022-09-30 20:36:30

论文研究

针对深度强化学习算法中存在的过估计问题，提出了一种目标动态融合机制，在Deep [Q] Networks（DQN）算法基础上进行改进，通过融合Sarsa算法的在线更新目标，来减少DQN算法存在的过估计影响，动态地结合了DQN算法和Sarsa算法各自优点，提出了DTDQN（Dynamic Target Deep [Q] Network）算法。利用公测平台OpenAI Gym上Cart-Pole控制问题进行仿真对比实验，结果表明DTDQN算法能够有效地减少值函数过估计，具有更好的学习性能，训练稳定性有明显提升。

立即下载

秒客网

论文研究-基于动态融合目标的深度强化学习算法研究.pdf

网友评论

相关文章