dqn:Caffe在太空侵略者上的深度Q学习

时间:2024-05-29 10:27:30
【文件属性】:

文件名称:dqn:Caffe在太空侵略者上的深度Q学习

文件大小:3.46MB

文件格式:ZIP

更新时间:2024-05-29 10:27:30

C++

概括 这是DeepMind的的第一个开源版本。 此外,还收集了基于人群的奖励信号,您可以使用它来训练模型,可以在这里找到: 细节 所有强化学习都是在Python中完成的。 此外,修改了以支持使用Solver::Solve拆分为OnlineUpdateSetup , OnlineUpdate和OnlineForward来在线观察训练数据,以设置内存数据层的输入,并 ,然后根据我们是在训练还是在表演而选择反向传播。 要使用人群奖励数据,请从上方下载并在您的环境中进行以下设置: export INTEGRATE_HUMAN_FEEDBACK=True 类似项目: 官方改进的DQN更新并于2月25日发布,基于Torch


网友评论