10.16182/j.issn1004731x.joss.22-0432
基于分配策略优化算法的智能防空任务分配
针对分配策略最优算法在大规模场景中求解速度不足的问题,基于马尔可夫决策过程,将深度强化学习与其相结合,将大规模防空任务分配问题进行智能化求解.根据大规模防空作战特点,利用马尔可夫决策过程对智能体进行建模,构建数字战场仿真环境;设计防空任务分配智能体,通过近端策略优化算法,在数字战场仿真环境中进行训练.以大规模防空对抗任务为例,验证了该方法的可行性和优越性.
分配策略优化算法、任务分配、马尔可夫决策过程、深度强化学习、智能体
35
TP391.9(计算技术、计算机技术)
国家自然科学基金62106283
2023-08-24(万方平台首次上网日期,不代表论文的发表时间)
共12页
1705-1716