稳定基线:OpenAI基线的一个分支,强化学习算法的实现

时间:2021-02-04 17:05:26
【文件属性】:
文件名称:稳定基线:OpenAI基线的一个分支,强化学习算法的实现
文件大小:2.38MB
文件格式:ZIP
更新时间:2021-02-04 17:05:26
python data-science machine-learning reinforcement-learning toolbox 稳定的基线 稳定基线是一组基于OpenAI的强化学习算法的改进实现。 您可以在“ 阅读有关“稳定基准”的详细介绍。 这些算法将使研究团体和行业更容易复制,完善和识别新想法,并将创建良好的基准以在其上构建项目。 我们希望这些工具将被用作添加新想法的基础,以及将新方法与现有方法进行比较的工具。 我们还希望这些工具的简单性将使初学者可以尝试使用更高级的工具集,而不会陷入实现细节中。 注意:尽管使用简单,但稳定基线(SB)假定您对强化学习(RL)有所了解。 未经实践,您不应该使用此库。 在这种程度上,我们在提供了很好的资源来开始使用RL。 与OpenAI基准的主要区别 该工具集是OpenAI B

网友评论