文件名称:强化学习原理、算法及应用 (2006年)
文件大小:2.78MB
文件格式:PDF
更新时间:2024-05-14 11:17:25
自然科学 论文
强化学习(Reinforcement Leaming RL)是从动物学习理论发展而来的,它不需要有先验知识,通过不断与环境交互来获得知识,自主的进行动作选择,具有自主学习能力,在自主机器人行为学习中受到广泛重视。本文综述了强化学习的基本原理,各种算法,包括TD算法、Q-学习和R学习等,最后介绍了强化学习的应用及其在多机器人系统中的研究热点问题。