论文研究-动作预测在多机器人强化学习协作中的应用.pdf

时间:2022-09-28 12:05:46
【文件属性】:

文件名称:论文研究-动作预测在多机器人强化学习协作中的应用.pdf

文件大小:509KB

文件格式:PDF

更新时间:2022-09-28 12:05:46

论文研究

在多机器人系统中,协作环境探索的强化学习的空间规模是机器人个数的指数函数,学习空间非常庞大造成收敛速度极慢。为了解决这个问题,将基于动作预测的强化学习方法及动作选择策略应用于多机器人协作研究中,通过预测机器人可能执行动作的概率以加快学习算法的收敛速度。实验结果表明,基于动作预测的强化学习方法能够比原始算法更快速地获取多机器人的协作策略。


网友评论