maddpg-replication

时间:2024-05-30 15:55:21
【文件属性】:

文件名称:maddpg-replication

文件大小:580.78MB

文件格式:ZIP

更新时间:2024-05-30 15:55:21

JupyterNotebook

maddpg-复制 这是的部分复制 。 该论文介绍了一种称为MADDPG(多主体深度确定性策略梯度)的算法,用于训练可以智能交互的多个主体。 作者发布了用于复制论文的。 该存储库记录了运行该代码的过程和结果。 尽管我(Nisan Stiennon)隶属于Google,但这不是Google的正式产品。 结果 查看以获取结果。 中的每个目录都包含: 每个第1000集的视频,就像。 经过训练的模型,包括名为以下文件的文件: 检查站 .data-00000-of-00001 。指数 .meta 每第1000集可获得奖励,以制作奖励图: agrewards.pkl,每个特工在剧集中的平均奖励 rewards.pkl,所有特工在整个情节中的平均奖励 来自Benchmark.pkl中经过全面训练的模型的特定于场景的性能数据 以下是Jupyter笔记本中使用的实验: simple_adv


网友评论