无人机的飞行路径规划之CH-PPO算法(思考)-三、CH-PPO算法在飞行速度和悬停位置优化上的创新

时间:2025-03-12 09:39:14

CH-PPO算法在无人机飞行速度和悬停位置优化方面具有显著创新,主要体现在以下几个方面:

1. 融合离散与连续策略的优化

CH-PPO算法通过同时优化无人机的访问次序、悬停位置和飞行速度,实现了对无人机路径规划的全面优化。与传统的强化学习算法相比,CH-PPO算法不仅考虑了离散动作(如访问次序),还结合了连续动作(如悬停位置和飞行速度),使得无人机的运动策略更加合理。

2. 悬停位置优化

CH-PPO算法通过优化无人机的悬停位置,减少了无效飞行距离。算法指导无人机集中采集某一区域的数据,避免了频繁的长距离移动。此外,CH-PPO算法在选择悬停位置时,更好地综合了后续访问节点的顺序,进一步缩短了飞行距离。

3. 飞行速度优化

CH-PPO算法根据任务需求和当前飞行路径动态调整无人机的飞行速度。算法通过结合信息时效性(AoI阈值)和飞行路径,指导无人机选择最优的飞行速度,从而在保证任务完成的前提下,减少任务完成时间。

4. 能耗优化

CH-PPO算法通过优化飞行路径和速度,显著减少了无人机的能量消耗。实验结果显示,CH-PPO算法在不同任务规模下均能显著降低无人机的能耗,且与DQN、PPO和VLC-GA等算法相比,差距随着任务规模的增加而逐渐扩大。

5. 算法的稳定性和鲁棒性

CH-PPO算法通过设计融合离散和连续策略的损失函数,增强了动作的合理性,提升了训练效果。实验验证了CH-PPO算法在不同学习率和裁剪系数下的奖励收敛结果,证明了其良好的稳定性和鲁棒性。

6. 实验结果

飞行距离:CH-PPO算法指导的无人机飞行距离显著少于其他算法,且差距随着任务规模的增加而扩大。

能量消耗:CH-PPO算法在不同任务规模下的能量消耗均少于其他算法,证明了其在能耗优化方面的优势。

CH-PPO算法通过融合离散和连续策略,优化了无人机的悬停位置和飞行速度,显著减少了飞行距离和能耗。其创新之处在于能够动态调整飞行策略,适应复杂任务需求,同时具备良好的稳定性和鲁棒性