文件名称:中国科学院大学高级人工智能复习总结
文件大小:2.37MB
文件格式:DOCX
更新时间:2022-03-02 12:14:17
test
策略估值的目标是为了寻找更优的策略(策略提升) 策略估值根据策略,计算其估值函数 策略提升 根据当前策略的估值函数,寻找更优的策略(如果存在),逐步寻 找到最优策略 根据策略,的估值函数,寻找更优策略 提升方法
文件名称:中国科学院大学高级人工智能复习总结
文件大小:2.37MB
文件格式:DOCX
更新时间:2022-03-02 12:14:17
test
策略估值的目标是为了寻找更优的策略(策略提升) 策略估值根据策略,计算其估值函数 策略提升 根据当前策略的估值函数,寻找更优的策略(如果存在),逐步寻 找到最优策略 根据策略,的估值函数,寻找更优策略 提升方法