maddpg-replication下载

【文件属性】：

文件名称：maddpg-replication

文件大小：580.78MB

文件格式：ZIP

更新时间：2024-05-30 15:55:21

JupyterNotebook

maddpg-复制这是的部分复制。该论文介绍了一种称为MADDPG（多主体深度确定性策略梯度）的算法，用于训练可以智能交互的多个主体。作者发布了用于复制论文的。该存储库记录了运行该代码的过程和结果。尽管我（Nisan Stiennon）隶属于Google，但这不是Google的正式产品。结果查看以获取结果。中的每个目录都包含：每个第1000集的视频，就像。经过训练的模型，包括名为以下文件的文件：检查站 .data-00000-of-00001 。指数 .meta 每第1000集可获得奖励，以制作奖励图： agrewards.pkl，每个特工在剧集中的平均奖励 rewards.pkl，所有特工在整个情节中的平均奖励来自Benchmark.pkl中经过全面训练的模型的特定于场景的性能数据以下是Jupyter笔记本中使用的实验： simple_adv

立即下载

秒客网

maddpg-replication

网友评论