论文研究-增强学习算法的性能测试与对比分析.pdf下载

【文件属性】：

文件名称：论文研究-增强学习算法的性能测试与对比分析.pdf

文件大小：503KB

文件格式：PDF

更新时间：2022-08-11 12:17:40

增强学习,值函数,近似策略迭代,平滑性

研究了几类典型增强学习算法的性能评估问题，包括Ｑ-学习算法、最小二乘策略迭代(LSPI)和基于核的最小二乘策略迭代 (KLSPI)算法等，重点针对Markov决策问题(MDP)的值函数平滑特性对算法性能的影响进行了研究。分别利用值函数非平滑的组合优化问题——旅行商问题（TSP）和值函数平滑的Mountain-Car运动控制问题，对不同增强学习算法的性能进行了测试和比较分析。分析了三种算法针对不同类型问题的各自特点，通过实验对比，验证了近似策略迭代算法，特别是KLSPI算法在解决值函数平滑的序贯决策问题时性

立即下载

秒客网

论文研究-增强学习算法的性能测试与对比分析.pdf

网友评论

相关文章