文件名称:论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf
文件大小:437KB
文件格式:PDF
更新时间:2022-09-05 03:46:44
策略梯度
全增量式自然梯度Actor-Critic学习算法,冯涣婷,程玉虎,尽管策略梯度强化学习算法具有较好的收敛性,但是在梯度估计过程中方差过大,影响了算法的性能。为了提高策略梯度算法的收敛速度
文件名称:论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf
文件大小:437KB
文件格式:PDF
更新时间:2022-09-05 03:46:44
策略梯度
全增量式自然梯度Actor-Critic学习算法,冯涣婷,程玉虎,尽管策略梯度强化学习算法具有较好的收敛性,但是在梯度估计过程中方差过大,影响了算法的性能。为了提高策略梯度算法的收敛速度