基于性能势的Markov控制过程双时间尺度仿真算法
在基于性能势的随机逼近方法中引入双时间尺度的概念,提出了离散时间Markov控制过程的基于性能势的双时间尺度仿真梯度算法,弥补了传统算法中每步更新算法更新频率过快和更新环更新算法更新频率过慢的不足,并利用三个数值例子来说明双时间尺度更新算法在计算复杂度、收敛速度和收敛精度上的优势.
Markov控制过程、性能势、双时间尺度、随机逼近
21
TP391.9(计算技术、计算机技术)
国家自然科学基金60574065,60774038
2010-07-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
4114-4119