ReAllY:您的强化学习盟友

时间:2024-04-02 03:58:31
【文件属性】:

文件名称:ReAllY:您的强化学习盟友

文件大小:165KB

文件格式:ZIP

更新时间:2024-04-02 03:58:31

ray reinforcement-learning-ally Python

真的 您的强化学习盟友。 基于tensorflow,RAY和Gym的框架,用于处理强化学习任务。 一般说明 该框架最初是为奥斯纳布吕克大学的“深度强化学习”基础课程构建的。 在模块课程中,要求学生在框架的帮助下实现深层的RL算法。 课程完成后,将发布示例解决方案。 该框架仍在建设中,尚待优化。 如果您遇到错误或发现使事情更有效的方法,请随时提出问题或直接与​​我联系(Charlie Lange, ),并帮助使此框架更适合每个人! 总体设计 ->插入图形 样本管理器 样品管理器使用远程运行器管理收集经验。 因此,必须使用环境规范和所使用的模型,代理的行为方式以及需要收集哪些数据来对其进行初始化。 缓冲 使用样本管理器,可以初始化一个缓冲区,可以在其中存储样本管理器通过其远程运行程序收集的数据,并且用户可以从中采样数据。 聚合器 使用样本管理器,可以初始化评估聚合器,其中可以存储来自主过


【文件预览】:
ReAllY-master
----gridworld.py(2KB)
----progress_test()
--------model_0_21-02-2021_01-44-59_AM()
--------model_5_21-02-2021_01-45-28_AM()
--------model_15_21-02-2021_01-46-32_AM()
--------model_0_24-02-2021_09-45-11_AM()
--------progress_20.png(40KB)
--------model_10_21-02-2021_01-46-02_AM()
----progress_a2c()
--------progress_20.png(44KB)
----environment.yml(4KB)
----README.md(8KB)
----showcase.py(4KB)
----really()
--------agent.py(9KB)
--------buffer.py(2KB)
--------utils.py(1KB)
--------__init__.py(48B)
--------runner_box.py(7KB)
--------sample_manager.py(15KB)
--------todo.txt(160B)
--------__pycache__()
--------agg.py(2KB)
----gridworlds()
--------setup.py(98B)
--------gridworlds.egg-info()
--------gridworlds()
----.gitignore(2KB)

网友评论