强化学习(TD算法)

时间:2015-07-21 04:36:30
【文件属性】:

文件名称:强化学习(TD算法)

文件大小:456KB

文件格式:PPT

更新时间:2015-07-21 04:36:30

强化学习 TD学习算法

强化学习的任务就是利用观察到的回报来学习针对某个环境的最优或接近最优策略。它作为一种无导师机器学习方法,把环境的反馈作为 输入、通过学习选择能达到其目标的最优动作


网友评论

  • TD算法讲的太少 不详细
  • 不错,大体了解了强化学习。
  • 挺好的...不过依然没弄懂...
  • 挺好的,有点帮助
  • 还不错呢 虽然不是很懂。没有代码 ,只有介绍
  • 对算法的描述不错,但是很有帮助
  • 介绍的很清楚,学习中
  • 对算法的描述不错,如果能够增加一些实现细节就更好了
  • 还不错吧,就是将的比较泛
  • 对算法的描述很详细。
  • 不错!很有帮助!谢谢!
  • 虽然还是不太明白,但是很有帮助
  • 程序本身编写的很详细 但是注释不够详细 希望 以后的程序 注释能够更详细些