10.3969/j.issn.1671-9565.2007.03.002
非合作环境下的决策方法研究
在对理性决策者决策过程建模基础上,研究了信息不对称的非合作环境中,存在着决策者效用函数U的先验概率分布p(u)(比如从一组效用函数中学习)的条件下,通过对决策者所已采取的行动的观察,生成效用函数U的约束条件集合,通过这些约束条件来确定其效用函数U后验分布q(u),从而推断他的效用函数U,用以预测他未来的行动的方法.本文提出了从策略观察中提取约束条件的算法,以及在非合作环境中,具有学习能力的谋略型决策者的行动策略.通过一个实例,研究相关的算法并进行了相应的实验.
理性决策、效用函数、决策树
6
F202(国民经济管理)
2007-12-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
7-12