论文研究-强化学习研究综述.pdf下载

【文件属性】：

文件名称：论文研究-强化学习研究综述.pdf

文件大小：309KB

文件格式：PDF

更新时间：2022-08-11 14:01:01

强化学习,多智能体,马尔可夫决策过程

在未知环境中，关于agent的学习行为是一个既充满挑战又有趣的问题，强化学习通过试探与环境交互获得策略的改进，其学习和在线学习的特点使其成为机器学习研究的一个重要分支。介绍了强化学习在理论、算法和应用研究三个方面最新的研究成果，首先介绍了强化学习的环境模型和其基本要素；其次介绍了强化学习算法的收敛性和泛化有关的理论研究问题；然后结合最近几年的研究成果，综述了折扣型回报指标和平均回报指标强化学习算法；最后列举了强化学习在非线性控制、机器人控制、人工智能问题求解、多agent 系统问题等若干领域的成功应用和未来的发展方向。

立即下载

秒客网

论文研究-强化学习研究综述.pdf

网友评论

相关文章