10.3778/j.issn.1002-8331.2008.15.002
局部合作多智能体Q-学习研究
强化学习在多Agent系统中面对的最大问题就是随着Agent数量的增加而导致的状态和动作空间的指数增长以及随之而来的缓慢的学习效率.采用了一种局部合作的Q-学习方法,只有在Agent之间有明确协作时才考察联合动作,否则,就只进行简单的个体Agent的Q-学习,从而使的学习时所要考察的状态动作对值大大减少.最后算法在捕食者-猎物的追逐问题和机器人足球仿真2D上的实验结果,与常用的多Agent强化学习技术相比有更好的效能.
多Agent系统、强化学习、Q-学习、局部合作
44
TP31(计算技术、计算机技术)
国家自然科学基金60273043;安徽省高校学科拔尖人才基金
2008-07-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
4-7