10.3321/j.issn:1001-0920.2003.03.003
Markov控制过程在紧致行动集上的迭代优化算法
研究一类连续时间Markov控制过程(CTMCP)在紧致行动集上关于平均代价性能准则的优化算法.根据CTMCP的性能势公式和平均代价最优性方程,导出了求解最优或次最优平稳控制策略的策略迭代算法和数值迭代算法,在无需假设迭代算子是sp-压缩的条件下,给出了这两种算法的收敛性证明.最后通过分析一个受控排队网络的例子说明了这种方法的优越性.
Markov控制过程、紧致行动集、性能势、策略迭代、数值迭代
18
TP202(自动化技术及设备)
国家自然科学基金69974037;国家高性能计算基金00208
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
267-271