10.3969/j.issn.1003-6059.2007.02.019
基于内省推理的多agent在线学习方法
多agent环境下agent的最优策略取决于其它agent的策略,这使得学习目标不易被清晰定义.基于客观观察行为建模的方法并不能很好体现智能体的个体理性.本文提出基于内省推理方法的多智能体环境下智能体高效在线学习方法,将基于对手模型的客观观察行为与基于换位思考推理的主观意图推测结合起来,智能体通过内省推理能够更多地得到对手的信息.针对经典协调博弈进行仿真实验,结果表明能取得较好的协调性能.
多智能体系统、在线学习、内省推理、电子市场
20
TP181.1(自动化基础理论)
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
254-260