DOI：10.3969/j.issn.1672-9722.2011.06.007

基于联合博弈的多Agent学习

引用

摘要：

在研究Q-Learning算法的基础上,将博弈论中的团队协作理论引入到强化学习中,提出了一种基于联合博弈的多Agent学习算法.该算法通过建立多个阶段博弈,根据回报矩阵对阶段博弈的结果进行评估,为其提供一种有效的Agent行为决策策略,使每个Agent通过最优均衡解或观察协作Agent的历史动作和自身当前情况来预测其所要执行的动作.对任务调度问题进行仿真实验,验证了该算法的收敛性.

关键词：Agent、强化学习、联合博弈、MAS

所属期刊栏目：39

分类号：TP181(自动化基础理论)

资助基金：国家自然科学基金项目50775060

在线出版日期：2011-09-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：21-24

英文信息展示

期刊专题