10.3321/j.issn:0469-5097.2001.02.001
AODE中基于强化学习的Agent协商模型
AODE是我们研制的一个面向Agent的智能系统开发环境.AODE中基于强化学习的Agent协商模型采用Markov决策过程和连续决策过程分别描述系统状态变化和特定系统状态的Agent协商过程,并将强化学习技术应用于Agent协商过程.该协商模型能够描述动态环境下的多Agent协商,模型中所有Agent都采用元对策Q学习算法时,系统能获得动态协商环境下的最优协商解.
多Agent系统、协商、强化学习
37
TP18(自动化基础理论)
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
135-141