文件名称:论文研究-基于RPkNN-Sarsa(.pdf
文件大小:1.06MB
文件格式:PDF
更新时间:2022-08-11 13:20:41
路径规划, 强化学习, 随机扰动, 传感器探测信息不确定性
基于kNN-Sarsaλ强化学习的机器人路径规划方法虽然收敛速度快, 但该算法容易陷入局部最优值, 且未考虑环境信息的不完全可观测性。为此, 设计了一种随机扰动random perturbationkNN-Sarsaλ强化学习算法, 利用Bayesian规则对传感器探测信息的不确定性进行了处理, 建立了基于栅格地图的仿真环境模型。仿真实验结果表明, 该方法不仅收敛性好, 能有效缓解kNN-Sarsaλ算法易陷入局部最优的现象, 且在传感器探测信息不确定的情况下仍能搜索到最优路径。