文件名称:smarties:轻便且可扩展的强化学习框架
文件大小:1.39MB
文件格式:ZIP
更新时间:2024-05-28 00:05:54
C++
聪明人 smarties是旨在满足以下目标的强化学习(RL)软件 [记住并忘记体验重放]( )的高性能C ++实现以及其他深度RL学习算法,包括V-RACER,CMA,PPO,DQN,DPG,ACER和NAF 。 环境应用程序在运行时确定要解决的控制问题的属性。 例如,环境中的代理数量,是他们正在解决相同的问题(因此他们都应该为学习共同的政策做出贡献)还是正在解决不同的问题(例如竞争或合作)。 每个代理的状态和操作空间的属性。 一个或多个代理正在处理部分可观察到的问题,这将导致学习者自动使用递归网络进行函数逼近。 观察是否必须通过卷积层及其属性进行预处理。 环境应用程序控制着学习进度。 更具体地说,smarties支持其API设计类似于OpenAI Gym的应用程序,在该应用程序中,环境是一个自包含的功能,可以调用该功能来接收新的观察结果并及时进行仿真。 但是,聪明人还支持更现实的A