10.3969/j.issn.1673-4785.2011.02.001
面向资源分配问题的Q-CF多智能体强化学习
多智能体强化学习算法在用于复杂的分布式系统时存在着状态空间大、学习效率低等问题.针对网络环境中的资源分配问题对多智能体强化学习算法进行了研究,将Q-学习算法和链式反馈(chain feedback,CF)学习算法相结合,提出了Q-CF多智能体强化学习算法,利用一种称为信息链式反馈的机制实现了多智能体之间的高效协同.仿真结果表明,和已有的多智能体Q-学习算法相比,该方法具有更加快速的收敛速度,同时保证了协同策略的性能优化.
多智能体系统、强化学习、资源分配、协同控制
6
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目60774076,90820302
2011-08-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
95-100