10.3969/j.issn.1000-3428.2007.22.015
基于黑板模型的多智能体合作学习
Q学习算法要求智能体无限遍历每个状态-动作转换,因此在涉及状态-动作空间非常大的应用问题时,导致收敛速度非常慢.借助多智能体的合作学习,智能体之间基于黑板模型的方法通过开关函数相互协调合作,可以更快地定位那些有效的状态-动作转换,避免了无效的更新,从而以较小的学习代价加快了Q表的收敛速度.
多智能体系统、合作学习、黑板模型
33
TP391(计算技术、计算机技术)
2008-01-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
42-44,47