10.19306/j.cnki.2095-8110.2022.05.009
Q-learning强化学习协同拦截制导律
为实现多枚导弹协同拦截机动目标,提升拦截效能,提出了一种Q-learning强化学习协同拦截制导律.首先,基于逃逸域覆盖理论,建立了非线性多弹协同拦截模型.其次,以视线角速率为状态,依据脱靶量构造奖励函数,通过离线训练生成强化学习智能体,并结合传统比例制导控制方法,构建基于强化学习的变导引系数制导律,实时生成实现协同拦截的制导指令.最终,通过数值仿真验证了所提算法的有效性和优越性.
协同拦截、强化学习、机动目标、逃逸域、制导律
9
TJ765.3+1(火箭、导弹)
国防科工委重点基础研究项目2019-JCJQ-ZD-049
2022-11-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
84-90