bellman:TensorFlow中基于模型的强化学习

时间:2024-05-20 19:53:07
【文件属性】:

文件名称:bellman:TensorFlow中基于模型的强化学习

文件大小:358KB

文件格式:ZIP

更新时间:2024-05-20 19:53:07

machine-learning reinforcement-learning deep-learning tensorflow deep-reinforcement-learning

贝尔曼 | | 贝尔曼做什么? Bellman是使用在Python中基于模型的强化学习(MBRL)的软件包,并在无模型的强化学习软件包的基础上构建。 Bellman提供了一个框架,可以灵活地组合基于模型的强化学习算法。 它提供了两大类算法:决策时间计划和背景计划算法。 在每堂课中,可以轻松地使用任何一种监督学习方法来学习环境的某些组成部分。 Bellman在设计时就考虑了模块化-可以灵活地组合重要组件,例如决策时间计划方法的类型(例如,交叉熵方法或随机射击方法)和状态转换模型的类型(例如,概率神经网络或神经网络)。神经网络的集合)。 Bellman还提供了几种流行的最新MBRL算法的实现,例如PETS,MBPO和METRPO。 包含更多详细信息。 Bellman需要使用Python 3.7及更高版本,并使用来运行计算,从而可以在GPU上快速执行。 维护者 贝尔曼最初是由(按字母


网友评论