基于强化学习的小型无人直升机有限时间收敛控制设计

引用

摘要：

针对小型无人直升机精确动力学模型难以获取以及姿态控制易受未知外界风扰影响的间题,设计一种基于强化学习(reinforcement learning,RL)与super twisting相结合的非线性控制算法.利用直升机在线飞行数据,训练执行者-评价者(actor-critic,AC)网络以逼近系统建模不确定部分.为了抑制未知外界风扰,提高系统鲁棒性,同时补偿AC网络逼近误差,设计基于super twisting的鲁棒控制算法.进而,利用Lyapunov稳定性分析方法证明无人直升机姿态误差能在有限时间内收敛到零.最后对所提出的算法进行实验验证,实验结果表明,所提出算法具有良好的控制效果,对系统不确定性和外界扰动具有良好的鲁棒性.

关键词：无人直升机、强化学习、鲁棒控制、未知外部扰动、有限时间收敛、实验验证

所属期刊栏目：35

分类号：TP273(自动化技术及设备)

资助基金：国家自然科学基金项目91748121,90916004,60804004

在线出版日期：2020-11-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：2646-2652

英文信息展示

期刊专题