10.3969/j.issn.1006-4303.2004.05.005
基于强化学习的多智能体协作实现
基于马尔科夫过程的强化学习作为一种在线学习方式,能够很好地应用于单智能体环境中.但是由于强化学习理论的限制,在多智能体系统中马尔科夫过程模型不再适用,因此强化学习不能直接用于多智能体的协作学习问题.本文提出了多智能体协作的两层强化学习方法.该方法主要通过在单个智能体中构筑两层强化学习单元来实现.第一层强化学习单元负责学习智能体的联合任务协作策略,第二层强化学习单元负责学习在本智能体看来是最有效的行动策略.所提出的方法应用于3个智能体协作抬起圆形物体的计算机模拟中,结果表明所提出的方法比采用传统强化学习方法的智能体协作得更好.
强化学习、Q学习、多智能体、协作
32
TP181(自动化基础理论)
浙江省自然科学基金 601078
2004-12-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
516-519,572