论文研究-对称协调博弈问题的多智能体强化学习.pdf

时间:2022-10-01 07:47:43
【文件属性】:

文件名称:论文研究-对称协调博弈问题的多智能体强化学习.pdf

文件大小:769KB

文件格式:PDF

更新时间:2022-10-01 07:47:43

论文研究

针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0和1两个值上调整即可协调成功。以多机器人避碰为实验背景进行仿真,表明算法比现有方法能够取得更好的协调性能。


网友评论