文件名称:论文研究-对称协调博弈问题的多智能体强化学习.pdf
文件大小:769KB
文件格式:PDF
更新时间:2022-10-01 07:47:43
论文研究
针对多机器人协调问题,利用协调博弈中智能体策略相似性,提出智能体的高阶信念修正模型和学习方法PEL,使智能体站在对手角度进行换位推理,进而根据信念修正将客观观察行为和主观信念推理结合起来。证明了信念修正模型的推理置信度只在0和1两个值上调整即可协调成功。以多机器人避碰为实验背景进行仿真,表明算法比现有方法能够取得更好的协调性能。