10.3321/j.issn:1001-0920.2001.04.006
一类Markov决策过程自适应决策的新方法
提出一种计算效率高且能以任意给定精度实现决策近优的新方法.该方法的原理是根据要求的决策精度对参数集进行有限分区,利用有偏极大似然估计器估计未知参数,并在决策过程中根据估计参数所在的分区获得控制对Markov过程进行决策.
Markov决策过程、有偏极大似然估计器、自适应决策、近似最优
16
TP217.2(自动化技术及设备)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
415-419