基于MATD3的视距内协同空战机动决策

引用

摘要：

为提升多无人作战飞机空战的协同作战能力,提出一种基于多智能体双延迟深度确定性策略梯度(MATD3)的协同空战机动决策方法.首先,基于无人作战飞机的三自由度动力学模型构建空战环境,并结合飞行员的操纵方式,设计以控制量的变化量表示的动作空间.其次,优化了状态空间和奖励函数的设计,将友机与敌机的相对关系引入状态空间,根据相对角度、相对距离等空战态势因素建立连续型奖励函数,将飞行约束条件融入离散型奖励函数,提升机动决策的准确性和机动飞行的安全性;采用分阶段训练、启发式引导、双探索机制、交替冻结博弈等训练方法,提高算法的收敛速度和机动策略的鲁棒性.最后,构建了二对一空战的仿真场景,结果表明我方双机能够展现出明显的配合行为,提高了对空战态势的感知能力.

关键词：无人作战飞机、协同空战、机动决策、多智能体、深度强化学习、MATD3

所属期刊栏目：30

分类号：TJ760(火箭、导弹)

资助基金：基础加强项目

在线出版日期：2023-07-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：20-28

英文信息展示

期刊专题