文件名称:high_mpc:学习模型预测控制的高级策略
文件大小:31.69MB
文件格式:ZIP
更新时间:2024-05-29 12:18:59
mpc quadrotor policysearch C
学习模型预测控制的高级策略 策略搜索和深度神经网络的结合有望实现各种决策任务的自动化。 模型预测控制(MPC)通过使用系统的动态模型并在较短的计划范围内在线解决优化问题,从而为机器人控制任务提供了可靠的解决方案。 在这项工作中,我们通过学习MPC(High-MPC)的深层高级策略,利用概率决策方法和人工神经网络的泛化功能来进行强大的在线优化。 受训的神经网络策略以机器人的本地观测为条件,能够为低级MPC控制器自适应地选择高级决策变量,然后为机器人生成最佳控制命令。 首先,我们将针对MPC的高级决策变量的搜索公式化为策略搜索问题,特别是概率推断问题。 该问题可以采用封闭形式的解决方案来解决。 其次,我们提出了一种用于学习神经网络高级策略的自监督学习算法,该算法可用于高度动态环境中的在线超参数调整。 我们通过使用提出的方法解决具有挑战性的控制问题,展示了将在线自适应技术整合到自主机器人中的重