基于Q-learning的弹道优化研究

引用

摘要：

为提升弹道优化效率,缩短作战响应时间,提出了一种基于Q-learning算法的简控弹道优化方法.首先在竖直平面内以3自由度(DOF)只受重力和空气阻力的质点弹丸为研究对象,建立无控弹道方程组作为参考模型并用龙格库塔法求解.在此基础上分别以最远飞行距离和最大落点速度为目标,以加速度指令直接控制输出,建立有控弹道优化模型.在设定初速度与出射角的情况下,在弹丸的外弹道飞行过程利用Q-learning算法输出控制指令,通过强化学习迭代计算实现弹道优化目标.仿真模拟结果证明,在强化学习控制下的导弹射程比无控时明显增加,表明所提出的优化设计方法可有效优化弹道,且效率高.

关键词：弹道优化、强化学习、Q-learning算法、外弹道

所属期刊栏目：43

分类号：TJ714(火箭、导弹)

资助基金：南京理工大学本科生科研训练百千万计划项目201810288058

在线出版日期：2022-07-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：191-196

英文信息展示

期刊专题