文件名称:论文研究-自适应重要采样Actor-Critic算法 .pdf
文件大小:341KB
文件格式:PDF
更新时间:2022-09-11 08:16:32
策略梯度
自适应重要采样Actor-Critic算法,冯涣婷,,在离策略Actor-Critic(AC)强化学习中,虽然Critic使用重要采样技术可以减小值函数估计的偏差,但是重要采样方法没有考虑估计的方差,算��
文件名称:论文研究-自适应重要采样Actor-Critic算法 .pdf
文件大小:341KB
文件格式:PDF
更新时间:2022-09-11 08:16:32
策略梯度
自适应重要采样Actor-Critic算法,冯涣婷,,在离策略Actor-Critic(AC)强化学习中,虽然Critic使用重要采样技术可以减小值函数估计的偏差,但是重要采样方法没有考虑估计的方差,算��