基于Q-learning的弹道优化研究
为提升弹道优化效率,缩短作战响应时间,提出了一种基于Q-learning算法的简控弹道优化方法.首先在竖直平面内以3自由度(DOF)只受重力和空气阻力的质点弹丸为研究对象,建立无控弹道方程组作为参考模型并用龙格库塔法求解.在此基础上分别以最远飞行距离和最大落点速度为目标,以加速度指令直接控制输出,建立有控弹道优化模型.在设定初速度与出射角的情况下,在弹丸的外弹道飞行过程利用Q-learning算法输出控制指令,通过强化学习迭代计算实现弹道优化目标.仿真模拟结果证明,在强化学习控制下的导弹射程比无控时明显增加,表明所提出的优化设计方法可有效优化弹道,且效率高.
弹道优化、强化学习、Q-learning算法、外弹道
43
TJ714(火箭、导弹)
南京理工大学本科生科研训练百千万计划项目201810288058
2022-07-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
191-196