基于PER-IDQN的多无人飞行器围捕研究
针对单无人飞行器能力有限,无法完成复杂军事场景下对敌方机动目标的压制等问题,提出了一种基于深度强化学习的多无人飞行器围捕方法.基于围捕任务,构建了栅格化场景,并对具体环境做出了说明.在深度强化学习的框架中,考虑到多无人飞行器对目标的靠近合围、安全避障等因素,对各飞行器状态变量、动作输出、奖励函数进行了针对性的设计.仿真结果表明:经过深度强化学习PER-IDQN算法的训练后,多无人飞行器能够完成自主协同决策和威胁规避,实现对机动目标的包围捕获.
机动目标、多无人飞行器、围捕任务、深度强化学习、协同决策
44
V249(航空仪表、航空设备、飞行控制与导航)
国家自然科学基金;电磁空间作战与应用重点实验室基金项目
2023-10-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
20-25