10.3873/j.issn.1000-1328.2019.02.009
再入飞行器自适应最优姿态控制
针对再入飞行器姿态控制问题,应用自适应动态规划(ADP)理论设计了姿态控制器.将再入飞行器的姿态控制建模为非线性系统的最优控制问题,提出单网络积分型强化学习(SNIRL)算法进行求解,该算法简化了积分型强化学习(IRL)算法在迭代计算中的执行-评价双网络结构,只需要采用评价网络估计值函数就可以求得最优控制律,其收敛性得到了理论证明.基于SNIRL算法设计了自适应最优控制器,并证明了闭环系统的稳定性.通过数值仿真校验了SNIRL算法比IRL算法计算效率更高,收敛速度更快,并校验了自适应最优姿态控制器的有效性.
再入飞行器、姿态控制、自适应最优控制、单网络积分型强化学习
40
V448.2(航天仪表、航天器设备、航天器制导与控制)
国家重点研发计划2016YFB1200100
2019-04-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
199-206