论文研究-自适应重要采样Actor-Critic算法 .pdf

时间:2022-09-11 08:16:32
【文件属性】:

文件名称:论文研究-自适应重要采样Actor-Critic算法 .pdf

文件大小:341KB

文件格式:PDF

更新时间:2022-09-11 08:16:32

策略梯度

自适应重要采样Actor-Critic算法,冯涣婷,,在离策略Actor-Critic(AC)强化学习中,虽然Critic使用重要采样技术可以减小值函数估计的偏差,但是重要采样方法没有考虑估计的方差,算��


网友评论