10.19297/j.cnki.41-1228/tj.2018.06.001
基于强化学习神经网的自适应高超声速飞行器控制
针对高超声速飞行器的跟踪控制问题, 提出了一种自适应最优非线性控制方法.该方法在增强学习机制的基础上,采用行为-评价体系结构( actor-critic architecture)设计自适应控制器.控制器的结构由两个相互作用的神经网络组成, 一个用于生成控制协议(称为actor NN) ,另一个用于评估控制策略(称为critic NN) .利用离散极小原理,得到了该自适应控制器的最优条件.仿真结果验证了该设计方法在高超声速飞行器跟踪控制中的有效性.
非线性控制、神经网络、增强学习、高超声速飞行器
TJ765;V448.2(火箭、导弹)
2019-02-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
3-10