基于深度强化学习的雷达智能抗干扰决策FPGA加速器设计

引用

摘要：

针对高动态环境下的雷达连续智能抗干扰决策和高实时性需求问题,本文构建了一种适用于雷达智能抗干扰决策的深度Q网络(Deep Q network,DQN)模型,并在此基础上提出了一种基于现场可编程门阵列(Field programmable gate array,FPGA)的硬件决策加速架构.在该架构中,本文设计了一种雷达智能决策环境交互片上访问方式,通过片上环境量化存储和状态迭代计算简化了DQN智能体连续决策时的迭代过程,在实现智能体深度神经网络的并行计算与流水控制加速的同时,进一步提升了决策实时性.仿真和实验结果表明,在保证决策正确率的前提下,所设计的智能抗干扰决策加速器相比已有的基于CPU平台的决策系统,在单次决策中实现了约46倍的速度提升,在连续决策中实现了约84倍的速度提升.

关键词：深度强化学习、深度Q网络、加速器、现场可编程门阵列、雷达智能决策

所属期刊栏目：38

分类号：TN911.7

在线出版日期：2023-10-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：1151-1161

英文信息展示

期刊专题