文件名称:非平稳随机优化-研究论文
文件大小:324KB
文件格式:PDF
更新时间:2024-06-29 07:18:07
stochastic approximation non-stationary
我们考虑顺序随机优化问题的非平稳变体,其中潜在的成本函数可能会沿地平线变化。 我们提出了一种称为变化预算的措施,用于控制所述变化的程度,并研究对该预算的限制如何影响可实现的性能。 我们确定了可以实现长期平均最优性和更精细的性能指标(例如速率最优性)的尖锐条件,这些指标完全表征了此类问题的复杂性。 在这样做的过程中,我们还在两个相当不同的文献链之间建立了牢固的联系:对抗性在线凸优化; 以及更传统的随机近似范式(在非平稳环境中表现)。 通过利用前者的最优政策结构,这种联系是在后者中获得良好政策的关键。 最后,极大极小遗憾的严格界限使我们能够量化“非平稳性的代价”,这在数学上捕捉了嵌入在时间变化环境中与静止环境中的附加复杂性。