10.3969/j.issn.2096-4641.2022.01.015
基于强化学习的一对多雷达干扰资源分配策略研究
针对干扰机一对多情形下的干扰突防问题,提出了一种基于强化学习的一对多干扰情形下的干扰资源分配方法,引入干扰辐射能量比和突防距离比作为评价指标,并对DQN(deep Q network)和Dueling-DQN算法引入动态调整的奖励值以增强算法的收敛能力.结合一对多干扰突防场景,对两种算法进行了验证,实验结果验证了两种算法的可行性及差异性,实现了对于干扰资源在干扰功率、时长、干扰样式及干扰雷达选取的资源分配能力,满足了一对多情形下的干扰资源实时、动态的分配需求.
干扰资源分配、强化学习、干扰辐射能量、最大突防距离、动作分配
5
TN974;TP181
上海航天科技创新基金SAST2019-001
2022-05-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
94-101