DOI：10.16383/j.aas.c201059

基于深度强化学习的多机协同空战方法研究

引用

摘要：

多机协同是空中作战的关键环节,如何处理多实体间复杂的协作关系、实现多机协同空战的智能决策是亟待解决的问题.为此,提出基于深度强化学习的多机协同空战决策流程框架(Deep-reinforcement-learning-based multi-aircraft cooperative air combat decision framework,DRL-MACACDF),并针对近端策略优化(Proximal policy optimization,PPO)算法,设计4种算法增强机制,提高多机协同对抗场景下智能体间的协同程度.在兵棋推演平台上进行的仿真实验,验证了该方法的可行性和实用性,并对对抗过程数据进行了可解释性复盘分析,研讨了强化学习与传统兵棋推演结合的交叉研究方向.

关键词：多机协同空战;智能决策;深度强化学习;PPO算法;增强机制

所属期刊栏目：47

资助基金：国家自然科学基金71701205,62073333

在线出版日期：2021-08-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：1610-1623

英文信息展示

期刊专题