多巴胺：多巴胺是用于强化学习算法的快速原型制作的研究框架下载

【文件属性】：

文件名称：多巴胺：多巴胺是用于强化学习算法的快速原型制作的研究框架

文件大小：5.9MB

文件格式：ZIP

更新时间：2024-02-24 19:30:07

google ai tensorflow ml rl

多巴胺多巴胺是用于强化学习算法的快速原型制作的研究框架。它旨在满足对小型，易处理的代码库的需求，用户可以在其中*地试验荒诞的想法（投机研究）。我们的设计原则是：轻松进行实验：使新用户可以轻松进行基准实验。灵活的开发：使新用户可以轻松尝试研究思路。紧凑且可靠：提供一些经过战斗测试的算法的实现。可重现：促进结果的可重现性。特别是，我们的设置遵循的建议。本着这些原则的精神，第一个版本专注于支持适用于Atari 2600游戏的最先进的单GPU Rainbow代理（）（）。。具体来说，我们的Rainbow代理实现了确定为最重要的三个组件： n步Be

立即下载

秒客网

多巴胺：多巴胺是用于强化学习算法的快速原型制作的研究框架

网友评论

相关文章