利用聚类分析法改进的多Agent协作强化学习方法

引用

摘要：

针对多agent系统强化学习中,状态空间和动作空间随着agent个数的增加成指数倍增长,进而导致维数灾难、学习速度慢和收敛性差的问题,提出了一种新型的混合强化学习方法,用于改进传统的多agent协作强化学习;该算法基于Friend-or-Foe Q-学习,事先采用聚类分析法对状态空间和动作空间进行预处理,降低空间维数后再进行强化学习,这就避免了同等状态环境下的重复劳动和对动作集的盲目搜索,理论上大大提高了agent的学习速度和算法的收敛性;文章首先进行改进算法的思想概述,然后给出了改进算法的学习框架和算法的一般描述.

关键词：多agent协作、强化学习、聚类分析、Friend-or-Foe、Q-学习

所属期刊栏目：18

分类号：TP18(自动化基础理论)

资助基金：江苏省自然科学基金项目BK2006176

在线出版日期：2010-06-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：923-926

英文信息展示

期刊专题