文件名称:181220010-丁豪-编程题31
文件大小:376KB
文件格式:PDF
更新时间:2022-08-03 16:22:40
第一个实验是基础Sarsa与Q学习的性能对比,参数选择上 按照题目的要求设定为0.1,因为是无折扣 第二个实验是n-Sarsa在n=1,3,5情况下的收益情况
文件名称:181220010-丁豪-编程题31
文件大小:376KB
文件格式:PDF
更新时间:2022-08-03 16:22:40
第一个实验是基础Sarsa与Q学习的性能对比,参数选择上 按照题目的要求设定为0.1,因为是无折扣 第二个实验是n-Sarsa在n=1,3,5情况下的收益情况