10.3321/j.issn:1001-0920.2004.09.005
马尔可夫决策过程复杂性的熵测度
应用Shannon熵和其他熵指数来度量马尔可夫决策的复杂性.将马尔可夫链的复杂性、不确定性和不可预测性的度量扩展到马尔可夫决策,提出一套基于信息理论的复杂性度量方法,可用于随机和确定性策略下的完全观测和不完全观测马尔可夫决策.对有关数值进行仿真研究,并给出了计算结果.
马尔可夫决策过程、复杂性、熵测度
19
TP14(自动化基础理论)
高等学校优秀青年教师教学科研奖励计划
2004-11-04(万方平台首次上网日期,不代表论文的发表时间)
共6页
983-987,993