true-online-td-lambda:使用傅里叶基函数逼近器实现 True Online TD(lambda)

时间:2024-06-27 04:09:35
【文件属性】:

文件名称:true-online-td-lambda:使用傅里叶基函数逼近器实现 True Online TD(lambda)

文件大小:14KB

文件格式:ZIP

更新时间:2024-06-27 04:09:35

Python

真在线TD(λ) 使用傅立叶基函数逼近器实现 True Online TD(lambda)。 [1][2] 参考 [1] Seijen、Harm V. 和 Rich Sutton。 “真正的在线 TD (lambda)。” 第 31 届机器学习国际会议 (ICML-14) 的论文集。 2014 年。 [2] 科尼达里斯,乔治。 “使用傅立叶基础的强化学习中的值函数近似。” (2008)。


【文件预览】:
true-online-td-lambda-master
----MANIFEST.in(152B)
----README.rst(486B)
----requirements.txt(50B)
----.travis.yml(820B)
----true_online_td_lambda()
--------optimization()
--------__init__.py(150B)
--------basis()
--------true_online_td_lambda.py(5KB)
--------learner_plotting_utilities.py(3KB)
----tox.ini(346B)
----setup.py(1KB)
----tests()
--------optimization()
--------__init__.py(0B)
--------basis()
--------test_true_online_td_lambda.py(3KB)
----.gitignore(719B)

网友评论