论文研究-基于因果图的FMDP问题的任务层次图的动态优化方法 .pdf

时间:2022-09-04 10:41:28
【文件属性】:

文件名称:论文研究-基于因果图的FMDP问题的任务层次图的动态优化方法 .pdf

文件大小:647KB

文件格式:PDF

更新时间:2022-09-04 10:41:28

复杂系统

基于因果图的FMDP问题的任务层次图的动态优化方法,周建才,王红兵,分层强化学习(Hierarchical Reinforcement Learning, HRL)是解决强化学习维数灾难问题的一种重要方法。分层强化学习的一个重要问题是任务的��


网友评论