Markov控制过程基于性能势的平均代价最优策略

引用

摘要：

研究了一类离散时间Markov控制过程平均代价性能最优控制决策问题.应用Markov性能势的基本性质,在很一般性的假设条件下,直接导出了无限时间平均代价模型在紧致行动集上的最优性方程及其解的存在性定理.提出了求解最优平稳控制策略的迭代算法,并讨论了这种算法的收敛性问题.最后通过分析一个实例来说明这种算法的应用.

关键词：Markov控制过程、性能势、平均代价模型、最优平稳策略

所属期刊栏目：28

分类号：TP202(自动化技术及设备)

资助基金：国家自然科学基金69974037;国家高性能计算基金00212

在线出版日期：2004-03-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：904-910

英文信息展示

期刊专题