一种基于Dyna-Q学习的旋翼无人机视觉伺服智能控制方法

引用

摘要：

基于图像的视觉伺服机器人控制方法通过机器人的视觉获取图像信息,然后形成基于图像信息的闭环反馈来控制机器人的合理运动.经典视觉伺服的伺服增益的选取在大多数条件下是人工赋值的,故存在鲁棒性差、收敛速度慢等问题.针对该问题,提出一种基于Dyna-Q的旋翼无人机视觉伺服智能控制方法调节伺服增益以提高其自适应性.首先,使用基于费尔曼链码的图像特征提取算法提取目标特征点;然后,使用基于图像的视觉伺服形成特征误差的闭环控制;其次,针对旋翼无人机强耦合欠驱动的动力学特性提出一种解耦的视觉伺服控制模型;最后,建立使用Dyna-Q学习调节伺服增益的强化学习模型,通过训练可以使得旋翼无人机自主选择伺服增益.Dyna-Q学习在经典的Q学习的基础上通过建立环境模型来存储经验,环境模型产生的虚拟样本可以作为学习样本来进行值函数的迭代.实验结果表明,所提出的方法相比于传统控制方法PID控制以及经典的基于图像视觉伺服方法具有收敛速度快、稳定性高的优势.

关键词：视觉伺服、Dyna-Q学习、增益调节、旋翼无人机、费尔曼连码、强化学习

所属期刊栏目：34

分类号：TP273(自动化技术及设备)

资助基金：航空科学基金项目2016ZC53022;国家重点研发计划项目SQ2017YFGX060091;西北工业大学研究生种子基金项目ZZ2018169

在线出版日期：2019-12-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：2517-2526

英文信息展示

期刊专题