多巴胺:多巴胺是用于强化学习算法的快速原型制作的研究框架

时间:2024-02-24 19:30:07
【文件属性】:

文件名称:多巴胺:多巴胺是用于强化学习算法的快速原型制作的研究框架

文件大小:5.9MB

文件格式:ZIP

更新时间:2024-02-24 19:30:07

google ai tensorflow ml rl

多巴胺 多巴胺是用于强化学习算法的快速原型制作的研究框架。 它旨在满足对小型,易处理的代码库的需求,用户可以在其中*地试验荒诞的想法(投机研究)。 我们的设计原则是: 轻松进行实验:使新用户可以轻松进行基准实验。 灵活的开发:使新用户可以轻松尝试研究思路。 紧凑且可靠:提供一些经过战斗测试的算法的实现。 可重现:促进结果的可重现性。 特别是,我们的设置遵循的建议 。 本着这些原则的精神,第一个版本专注于支持适用于Atari 2600游戏的最先进的单GPU Rainbow代理( )( )。 。 具体来说,我们的Rainbow代理实现了确定为最重要的三个组件 : n步Be


网友评论