10.3969/j.issn.1000-1093.2021.09.025
基于强化学习的集群多目标分配与智能决策方法
为提升高动态协同攻击条件下的攻防效能,研究基于强化学习的集群多目标智能分配与决策方法.建立综合攻击性能评估准则,包括基于相对运动信息的攻击优势度评估以及基于目标固有信息的威胁度评估.综合攻击性能、突防概率以及攻击消耗,设计攻防效费比性能指标.构建基于强化学习的多目标决策架构,设计以分配向量为基本元素的动作空间,以及基于量化性能指标的状态空间,利用Q-Learning方法对协同攻击方案,包括导弹选取以及分配形式进行智能决策.仿真结果表明,强化学习能够实现攻防效能最优的多目标在线决策,其计算效率相对于粒子群优化算法具有更明显的优势.
目标分配;协同攻击;攻防效能;智能决策;强化学习
42
TJ761.1+4(火箭、导弹)
国家自然科学基金项目;中国博士后科学基金项目
2021-11-02(万方平台首次上网日期,不代表论文的发表时间)
共9页
2040-2048