论文研究-平均和折扣报酬准则下的逆向强化学习 .pdf

时间:2022-09-05 21:41:39
【文件属性】:

文件名称:论文研究-平均和折扣报酬准则下的逆向强化学习 .pdf

文件大小:542KB

文件格式:PDF

更新时间:2022-09-05 21:41:39

报酬函数构建

平均和折扣报酬准则下的逆向强化学习,陶钊榕,陈智超,逆向强化学习是利用专家示教行为构建潜在报酬函数的过程。本文从性能灵敏度分析的角度研究了逆向强化学习的原理,通过分析专家策


网友评论