SARSA 强化学习：使用 SARSA 解迷宫，强化学习-matlab开发下载

【文件属性】：

文件名称：SARSA 强化学习：使用 SARSA 解迷宫，强化学习-matlab开发

文件大小：118KB

文件格式：ZIP

更新时间：2024-06-20 19:40:40

matlab

参考 6.4 (Sarsa: On-Policy TD Control), Reinforcement learning: An Introduction, RS Sutton, AG Barto, MIT press 在这个演示中，强化学习技术 SARSA 解决了两个不同的迷宫。 State-Action-Reward-State-Action (SARSA) 是一种用于学习马尔可夫决策过程策略的算法，用于强化学习。 SARSA，动作价值函数的更新： Q(S{t}, A{t}) := Q(S{t}, A{t}) + α*[ R{t+1} + γ ∗ Q(S{t+1}, A{ t+1}) − Q(S{t}, A{t}) ] 学习率 (α) 学习率决定了新获取的信息在多大程度上覆盖旧信息。因子为 0 将使代理不学习任何东西，而因子为 1 将使代理仅考虑最近的信息。折扣系数 (γ)

立即下载

秒客网

SARSA 强化学习：使用 SARSA 解迷宫，强化学习-matlab开发

网友评论

相关文章