10.3969/j.issn.1003-6059.2005.02.018
一种共享经验元组的多agent协同强化学习算法
Q学习算法是一种最受欢迎的模型无关强化学习算法.本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高.最后将该算法应用于猎人捕物问题域.实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的.
多agent学习、强化学习、Q学习、状态行为空间、协作团队
18
TP391(计算技术、计算机技术)
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
234-239