基于Q-Learning算法和神经网络的飞艇控制

引用

摘要：

针对现代飞艇控制中动力学模型不确定性带来的系统建模和参数辨识工作较为复杂的问题,提出了一种基于自适应建模和在线学习机制的控制策略.设计了一种在分析实际运动的基础上建立飞艇控制马尔可夫决策过程(MDP)模型的方法,具有自适应性.采用Q-Learning算法进行在线学习并利用小脑模型关节控制器(CMAC)神经网络对动作值函数进行泛化加速.对本文方法进行仿真并与经过参数整定的PID控制器对比,验证了该控制策略的有效性.结果表明,在线学习过程能够在数小时内收敛,通过自适应方法建立的MDP模型能够满足常见飞艇控制任务的需求.本文所提控制器能够获得与PID控制器精度相当且更为智能的控制效果.

关键词：飞艇、马尔可夫决策过程(MDP)、机器学习、Q-Learning、小脑模型关节控制器(CMAC)

所属期刊栏目：43

分类号：V274;V249.22(各类型航空器)

在线出版日期：2018-05-07（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：2431-2438

英文信息展示

期刊专题