文件名称:可数半Markov决策过程折扣代价性能优化 (2006年)
文件大小:816KB
文件格式:PDF
更新时间:2024-06-16 12:13:06
自然科学 论文
讨论一类可数半Markov决策过程(CSMDP)在折扣代价准则下的性能优化问题。运用等价Markov过程方法,定义了折扣Poisson方程,并由该方程定义了α-势。基于α-势,导出了由最优平稳策略所满足的最优性方程。较为详细地讨论了最优性方程解的存在性问题,并给出了其解存在的一些充分条件。
文件名称:可数半Markov决策过程折扣代价性能优化 (2006年)
文件大小:816KB
文件格式:PDF
更新时间:2024-06-16 12:13:06
自然科学 论文
讨论一类可数半Markov决策过程(CSMDP)在折扣代价准则下的性能优化问题。运用等价Markov过程方法,定义了折扣Poisson方程,并由该方程定义了α-势。基于α-势,导出了由最优平稳策略所满足的最优性方程。较为详细地讨论了最优性方程解的存在性问题,并给出了其解存在的一些充分条件。