DOI：10.3969/j.issn.1001-9944.2015.07.004

基于人工情感的Q-学习算法在机器人行为决策中的应用

引用

摘要：

为了提高经典强化学习算法在机器人行为最优控制策略中学习的效率和收敛速度,在利用环境模型提高强化学习速度方法的基础上,将人类情感具有的趋利避害生存机理应用于环境模型经验知识的学习中,提出了基于人工情感的Q-学习算法,并将该算法应用于机器人的行为决策.在有障碍的二维栅格环境下对机器人路径寻优进行了仿真测试,仿真实验结果表明该算法较基于环境模型的Q-学习算法具有更高的学习效率和收敛速度.其改进算法对于提高机器人自主决策能力具有较高的理论意义及推广应用价值.

关键词：强化学习、Q-学习算法、人工情感、机器人、最优控制策略

所属期刊栏目：30

分类号：TP273.22(自动化技术及设备)

资助基金：国家自然科学基金资助项目61170117;河北省教育厅资助河北省高等学校科学技术研究重点项目ZD2014074;河北联合大学博士科研启动项目

在线出版日期：2016-09-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：13-16,48

英文信息展示

期刊专题