Dopamine:强化学习算法原型设计框架-开源

时间:2021-06-23 19:16:52
【文件属性】:
文件名称:Dopamine:强化学习算法原型设计框架-开源
文件大小:4.01MB
文件格式:ZIP
更新时间:2021-06-23 19:16:52
开源软件 多巴胺是一个用于强化学习算法快速原型设计的研究框架。 它旨在满足对一个小型、易于理解的代码库的需求,用户可以在其中*地尝试疯狂的想法(推测性研究)。 第一个版本侧重于支持应用于 Atari 2600 游戏(Bellemare 等人,2013 年)的最先进的单 GPU Rainbow 代理(Hessel 等人,2018 年)。 具体来说,我们的 Rainbow 代理实现了 Hessel 等人认为最重要的三个组件:n 步 Bellman 更新、优先体验重放和分布式强化学习。 为了完整性,我们还提供了 DQN 的实现(Mnih 等,2015)。 有关其他详细信息,请参阅我们的文档。 我们提供了一组 Colaboratory 笔记本,用于演示如何使用多巴胺。 我们提供了一个网站,其中显示了所有提供的代理在所有游戏中的学习曲线。

网友评论