10.3969/j.issn.1672-9722.2011.06.007
基于联合博弈的多Agent学习
在研究Q-Learning算法的基础上,将博弈论中的团队协作理论引入到强化学习中,提出了一种基于联合博弈的多Agent学习算法.该算法通过建立多个阶段博弈,根据回报矩阵对阶段博弈的结果进行评估,为其提供一种有效的Agent行为决策策略,使每个Agent通过最优均衡解或观察协作Agent的历史动作和自身当前情况来预测其所要执行的动作.对任务调度问题进行仿真实验,验证了该算法的收敛性.
Agent、强化学习、联合博弈、MAS
39
TP181(自动化基础理论)
国家自然科学基金项目50775060
2011-09-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
21-24