10.16182/j.issn1004731x.joss.22-0886
基于深度强化学习的立体投送策略优化方法研究
基于深度强化学习算法在策略优化问题中的良好表现,以立体投送作战行动为主要研究对象,提出了一种深度强化学习框架与仿真推演实验协同的作战行动策略优化方法.在分析策略优化研究现状的基础上,根据研究问题对深度学习框架进行了分析比较,构建了基于A3C算法的深度强化学习立体投送策略模型,并通过仿真推演和分布式计算,实现深度强化学习模型与"人不在回路"仿真推演的交互学习,获得优化后的立体投送策略,验证了深度强化学习框架与仿真推演实验协同优化策略的有效性.
深度强化学习、仿真推演、策略优化、立体投送、A3C算法
36
TP391.9(计算技术、计算机技术)
2024-02-02(万方平台首次上网日期,不代表论文的发表时间)
共11页
39-49