文件名称:论文研究-分层强化学习研究进展.pdf
文件大小:58KB
文件格式:PDF
更新时间:2022-08-11 13:50:53
分层强化学习,半马尔可夫决策过程,抽象
首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础;其次,较全面地比较HAM、options、MAXQ和HEXQ四种典型的学习方法,从典型学习方法的拓展、学习分层、部分感知马尔可夫决策过程、并发和多agent合作等方面讨论分层强化学习的研究现状;最后指出分层强化学习未来的发展方向。
文件名称:论文研究-分层强化学习研究进展.pdf
文件大小:58KB
文件格式:PDF
更新时间:2022-08-11 13:50:53
分层强化学习,半马尔可夫决策过程,抽象
首先介绍了半马尔可夫决策过程、分层与抽象等分层强化学习的理论基础;其次,较全面地比较HAM、options、MAXQ和HEXQ四种典型的学习方法,从典型学习方法的拓展、学习分层、部分感知马尔可夫决策过程、并发和多agent合作等方面讨论分层强化学习的研究现状;最后指出分层强化学习未来的发展方向。