acme:强化学习组件和代理库

时间:2021-02-09 20:18:09
【文件属性】:
文件名称:acme:强化学习组件和代理库
文件大小:1.18MB
文件格式:ZIP
更新时间:2021-02-09 20:18:09
research reinforcement-learning agents Python Acme:强化学习的研究框架 | | | Acme是增强学习(RL)代理和代理构建块的​​库。 Acme致力于公开简单,高效且易读的代理,这些代理既可以作为流行算法的参考实现,也可以作为强大的基准,同时仍提供足够的灵活性来进行新颖的研究。 Acme的设计还尝试以不同的复杂性级别为RL问题提供多个切入点。 总览 如果您只是想快速开始使用Acme,则要了解该库的主要知识是,我们公开了许多代理实现和一个EnvironmentLoop原语,可以按如下方式使用它: loop = acme . EnvironmentLoop ( environment , agent ) loop . run () 这将运行一个简单的循环,其中给定的代理与其环境交互并从此交互中学习。 假设有一个agent实例(可在找到其实现)和一个environment实例,该实例实现 。 每个单独的代理还包括一个README

网友评论