依赖于历史的折扣半马氏决策规划 (1989年)

时间:2024-06-15 15:48:36
【文件属性】:

文件名称:依赖于历史的折扣半马氏决策规划 (1989年)

文件大小:3.87MB

文件格式:PDF

更新时间:2024-06-15 15:48:36

自然科学 论文

研究*报酬折扣半马氏决策规划问题.证明了:策略π・=(π1・,π2・,…πn・,π・n+1,…)是最优策略,则π1・(∞)及(π1・,π2・,…,πn・)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn・(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。


网友评论