10.3969/j.issn.1002-0640.2023.03.004
基于课程强化学习的联合海空博弈决策模型训练方法
针对多智能体深度强化学习在解决联合海空作战战术博弈决策模型难以训练优化问题,结合多智能体深度强化学习在智能化指挥决策问题中的应用性优势,以及课程学习在复杂问题研究中的改进优势,构建基于马尔可夫决策过程的联合海空战术决策过程模型,提出基于复杂度指数函数的任务复杂性度量方法,建立基于值分解网络算法的求解模型.针对一个典型联合海空作战战术决策场景,构建从易到难的课程学习任务和模型求解框架,设计针对任务的决策模型训练方法,在兵棋推演仿真系统上,对模型训练方法的可行性进行了验证.
课程学习、作战环境、联合海空作战、智能博弈、深度强化学习
48
TP181(自动化基础理论)
国家自然科学基金61806221
2023-05-19(万方平台首次上网日期,不代表论文的发表时间)
共11页
25-34,42