论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf下载

【文件属性】：

文件名称：论文研究-全增量式自然梯度Actor-Critic学习算法 .pdf

文件大小：437KB

文件格式：PDF

更新时间：2022-09-05 03:46:44

策略梯度

全增量式自然梯度Actor-Critic学习算法，冯涣婷，程玉虎，尽管策略梯度强化学习算法具有较好的收敛性，但是在梯度估计过程中方差过大，影响了算法的性能。为了提高策略梯度算法的收敛速度

立即下载

秒客网