DOI：10.3969/j.issn.1001-0645.2004.08.007

一种基于意图跟踪和强化学习的agent模型

引用

摘要：

针对动态对抗的多agent系统(MAS)环境中agent行为前摄性较差的问题,提出了一种将意图跟踪和强化学习相结合的agent模型.该模型将对手信息和环境信息分开处理,在agent的BDI心智模型中引入了Q-学习机制应对环境变化;在强化学习的基础上注重对对手和对手团队的意图跟踪,改进Tambe的意图跟踪理论,针对特定对抗环境中的对手行为建立对手模型,跟踪对手和对手团队的意图,预测对手目标,以调整自身行为.实验证明,所提出的agent模型具有更强的自主性和适应性,在动态对抗系统中具有更强的生存能力.

关键词：多智能体系统、意图跟踪、Q-学习、BDI模型

所属期刊栏目：24

分类号：TP181(自动化基础理论)

资助基金：国家高技术研究发展计划863计划2002AA735051

在线出版日期：2004-10-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：679-682

英文信息展示

期刊专题