Stable Baselines:一组基于OpenAI Baselines强化学习算法的改进实现-python

时间:2024-07-08 12:10:46
【文件属性】:

文件名称:Stable Baselines:一组基于OpenAI Baselines强化学习算法的改进实现-python

文件大小:2.39MB

文件格式:ZIP

更新时间:2024-07-08 12:10:46

机器学习

Stable Baselines:一组基于OpenAI Baselines强化学习算法的改进实现 Stable Baselines Stable Baselines 是一组基于 OpenAI Baselines 的强化学习算法的改进实现。 您可以在 Medium 文章中阅读有关稳定基线的详细介绍。 这些算法将使研究社区和行业更容易复制、改进和识别新想法,并将创建良好的基线以在其上构建项目。 我们希望这些工具将被用作可以添加新想法的基础,以及将新方法与现有方法进行比较的工具。 我们也希望这些工具的简单性能让初学者尝试更高级的工具集,而不会被实现细节所淹没。 注意:尽管使用简单,但稳定基线 (SB) 假定您对强化学习 (RL) 有一定的了解。 你不应该在没有练习的情况下使用这个库。 在这个程度上,我们在文档中提供了很好的资源来开始使用 RL。 与 OpenAI Baselines 的主要区别 此工具集是 OpenAI Baselines 的一个分支,具有主要的结构重构和代码清理: 所有算法的统一结构 PEP8 兼容(统一代码样式) 文档化的函数和类 更多测试和更多代码覆盖


网友评论