文件名称:Q_学习及其在智能机器人局部路径规划中的应用研究
文件大小:276KB
文件格式:PDF
更新时间:2015-03-14 14:25:52
Q_学习 局部路径规划
强化学习一词来自于行为心理学, 这门学科把行为学习看成反复试验的过程, 从而把环境状态映射成相 应的动作. 在设计智能机器人过程中, 如何来实现行为主义的思想、在与环境的交互中学习行为动作? 文中把机器 人在未知环境中为躲避障碍所采取的动作看作一种行为, 采用强化学习方法来实现智能机器人避碰行为学习. Q 2 学习算法是类似于动态规划的一种强化学习方法, 文中在介绍了Q 2学习的基本算法之后, 提出了具有竞争思想和 自组织机制的Q 2学习神经网络学习算法; 然后研究了该算法在智能机器人局部路径规划中的应用,