文件名称:强化学习(TD算法)
文件大小:456KB
文件格式:PPT
更新时间:2015-07-21 04:36:30
强化学习 TD学习算法
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为 输入、通过学习选择能达到其目标的最优动作
文件名称:强化学习(TD算法)
文件大小:456KB
文件格式:PPT
更新时间:2015-07-21 04:36:30
强化学习 TD学习算法
强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为 输入、通过学习选择能达到其目标的最优动作