通过离线模拟进行在线规划-研究论文

时间:2024-06-29 20:14:23
【文件属性】:

文件名称:通过离线模拟进行在线规划-研究论文

文件大小:1.32MB

文件格式:PDF

更新时间:2024-06-29 20:14:23

Online Planning; Non-Stationary Environment;

(有限范围)在线规划问题的核心问题之一是综合实时决策对系统后续状态的影响,以及剩余时间范围内的性能(cost-to-go函数)。 一个完整的解决方案通常会导致棘手的动态规划问题。 在本文中,我们针对这个问题提出了一种计算效率高的方法,该方法在非平稳环境中获得近乎最佳的性能。 更具体地说,我们研究了一类具有凹目标函数和(全局)可行性约束的在线规划问题。 供应链管理、在线广告和网络收入管理等方面的广泛问题,都可以使用该在线计划框架进行适当建模。 利用从离线模拟(从分布信息生成)中获得的“梯度”信息的价值,我们开发了一种通用方法来促进此类问题的在线规划。 此外,我们提出的方法产生了具有亚线性遗憾的近乎最优的解决方案,并以高概率满足可行性约束。 我们提供了大量的数值证据来验证这种方法的性能,并讨论其对假设基础环境是静止的现有技术的改进。


网友评论