DOI：10.3969/j.issn.1674-0262.2005.04.016

基于贝叶斯方法的多Agent强化学习

引用

摘要：

在多agentss强化学习(MARL)的研究中,很多都是强调MARL算法收敛于期望平衡解.然而,对于标准的强化学习,该过程需要对策略空间的充分探测,而且探测还经常受到惩罚或错失了良机.在多agents系统中,由于agents之间的协作使该问题更加复杂.为此,提出了在MARL用贝叶斯模型来进行最优探测,该模型与标准的RL模型不同,它将对agent的动作是如何影响其它agents的行为进行推理.同时,还给出了如何对最优贝叶斯探测进行处理以获得理想的结果,并通过与其它算法的比较来说明用贝叶斯方法的可行性.

关键词：贝叶斯方法、多agents、强化学习

所属期刊栏目：27

分类号：TP18(自动化基础理论)

在线出版日期：2006-02-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：65-68

英文信息展示

期刊专题