连续时间MCP在紧致行动集上的最优策略
文中研究了一类连续时间Markov控制过程(CTMCP)无穷水平平均代价性能的最优控制决策问题.文章采用无穷小生成元和性能势的基本性质,直接导出了平均代价模型在紧致行动集上的最优性方程及其解的存在性定理,提出了求解ε-最优平稳控制策略的数值迭代算法,并给出了这种算法的收敛性证明.最后通过分析一个数值例子来说明这种方法的应用.
性能势、平均代价准则、紧致行动集、数值迭代
29
TP202(自动化技术及设备)
国家自然科学基金00208
2004-03-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
206-211