分层决策多机空战对抗方法

引用

摘要：

在空战研究领域,战术决策旨在提高博弈对抗收益,进而提升战机攻击效率.现有战术决策算法大多基于规则方法设计,当应用于多机空战的复杂环境时则存在设计难度大,难以求解最优解等问题.本文提出一种分层决策多机空战对抗方法,首先,在训练初始阶段借鉴已有人类专家经验,指导模型训练;其次,根据战术动作类型设计分层动作决策网络,降低动作决策空间维度;最后,将训练产生的对抗经验按阶段分解,降低策略学习难度.在多机空战仿真环境中进行了实验验证,相比于现有多机空战决策方法,本文提出的方法在训练收敛性和决策性能方面均具有更好的表现.

关键词：多机空战、动作决策网络、博弈、分层强化学习、决策收益

所属期刊栏目：52

分类号：TP301.6;E926.391;TJ85

资助基金：科技创新新一代人工智能重大项目2030;2018AAA0100803

在线出版日期：2023-01-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：2225-2238

英文信息展示

期刊专题