DOI：10.3969/j.issn.1007-130X.2019.01.022

基于Q-learning的不确定环境BDI Agent最优策略规划研究

引用

摘要：

BDI模型能够很好地解决在特定环境下的Agent的推理和决策问题,但在动态和不确定环境下缺少决策和学习的能力.强化学习解决了Agent在未知环境下的决策问题,却缺少BDI模型中的规则描述和逻辑推理.针对BDI在未知和动态环境下的策略规划问题,提出基于强化学习Q-learning算法来实现BDI Agent学习和规划的方法,并针对BDI的实现模型ASL的决策机制做出了改进,最后在ASL的仿真平台Jason上建立了迷宫的仿真,仿真实验表明,在加入Q-learning学习机制后的新的ASL系统中,Agent在不确定环境下依然可以完成任务.

关键词：BDI Agent、强化学习、Q-learning、ASL、Jason、规划

所属期刊栏目：41

分类号：TP311(计算技术、计算机技术)

资助基金：国家自然科学基金61502355;武汉工程大学第九届研究生教育创新基金CX2017068

在线出版日期：2019-03-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：166-172

英文信息展示

期刊专题