10.3969/j.issn.1672-9730.2022.10.019
基于强化学习的雷达抗复合干扰
针对传统雷达抗复合干扰决策难、时间长、难以预测的问题,提出了一种基于先验知识强化学习的雷达抗复合干扰的方法.该方法将雷达单一干扰效益,拓展到复合干扰效益,进一步得到复合干扰转化概率矩阵,通过强化学习得到动作价值矩阵,确定最优抗复合干扰策略.实验仿真发现:与传统的Q-learning相比,基于先验条件的雷达智能抗干扰决策更加贴近战场情况,可以较为准确地预测下接下来干扰状态,为指挥员提供决策依据.
强化学习、抗复合干扰、复合干扰转移概率、动作价值矩阵
42
TN974
军内科研项目DJYJNKY2019-018
2023-01-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
83-86,92