文件名称:Multi-Agent-Deep-Deterministic-Policy-Gradients:多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现
文件大小:6KB
文件格式:ZIP
更新时间:2024-05-06 07:51:29
reinforcement-learning deep-reinforcement-learning actor-critic-methods actor-critic-algorithm multi-agent-reinforcement-learning
多代理深确定性策略梯度 多主体深度确定性策略梯度(MADDPG)算法的Pytorch实现 这是我在论文中提出的算法的实现:“针对混合合作竞争环境的多主体Actor评论家”。 您可以在这里找到本文: : 您将需要安装多代理粒子环境(MAPE),可以在这里找到: : 确保创建具有MAPE依赖项的虚拟环境,因为它们有些过时了。 我还建议使用PyTorch 1.4.0版运行此程序,因为最新版本(1.8)似乎与我在计算批评者损失时使用的就地操作存在问题。 将主存储库克隆到与MAPE相同的目录中可能是最容易的,因为主文件需要该软件包中的make_env函数。 可以在以下位置找到本教程的视频: :
【文件预览】:
Multi-Agent-Deep-Deterministic-Policy-Gradients-master
----buffer.py(3KB)
----maddpg.py(3KB)
----agent.py(3KB)
----README.md(1024B)
----networks.py(2KB)
----main.py(2KB)