文件名称:27、Model-free控制1
文件大小:1.83MB
文件格式:PDF
更新时间:2022-08-03 21:57:53
算法
1. 首先从环境中使用策略 采样k个episode: 2. 对于在episode中的每个状态 3. 基于新得到的Q函数更新策略:
文件名称:27、Model-free控制1
文件大小:1.83MB
文件格式:PDF
更新时间:2022-08-03 21:57:53
算法
1. 首先从环境中使用策略 采样k个episode: 2. 对于在episode中的每个状态 3. 基于新得到的Q函数更新策略: