10.16615/j.cnki.1674-8190.2021.03.11
基于深度确定性策略梯度算法的战机规避中距空空导弹研究
飞机规避中距空空导弹的逃逸机动策略对于提高战斗机的生存力至关重要.针对深度确定性策略梯度算法训练智能体学习飞机规避导弹的逃逸机动策略进行研究.以飞机导弹相对态势参数等作为智能体的输入状态,飞机控制指令作为智能体的输出动作,导弹飞机追逃模型作为智能体的学习环境,设计由相对态势和飞行参数构成的成型奖励以及由交战结果组成的稀疏奖励,实现从状态参数到控制量端到端的逃逸机动策略.通过与四种基于专家先验知识的典型逃逸机动攻击区仿真验证对比,结果表明:智能体实现的逃逸策略攻击区仅次于置尾下降攻击区,该策略对飞机规避导弹先验知识的依存度最低.
导弹规避、逃逸机动策略、深度确定性策略梯度、深度强化学习
12
V212.1;E91;E926.3(基础理论及试验)
国家自然科学基金11672236
2021-07-05(万方平台首次上网日期,不代表论文的发表时间)
共10页
85-94