文件名称:依赖于历史的折扣半马氏决策规划 (1989年)
文件大小:3.87MB
文件格式:PDF
更新时间:2024-06-15 15:48:36
自然科学 论文
研究*报酬折扣半马氏决策规划问题.证明了:策略π・=(π1・,π2・,…πn・,π・n+1,…)是最优策略,则π1・(∞)及(π1・,π2・,…,πn・)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn・(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。
文件名称:依赖于历史的折扣半马氏决策规划 (1989年)
文件大小:3.87MB
文件格式:PDF
更新时间:2024-06-15 15:48:36
自然科学 论文
研究*报酬折扣半马氏决策规划问题.证明了:策略π・=(π1・,π2・,…πn・,π・n+1,…)是最优策略,则π1・(∞)及(π1・,π2・,…,πn・)(∞)对同一折扣因子函数也是最优的,对任给的整数n≥1,在一定的条件下,πn・(∞)也是最优的;证明了若最优策略存在,必存在最优平稳策略;证明了ε最优平稳策略的存在性。