DOI：10.16182/j.issn1004731x.joss.22-0886

基于深度强化学习的立体投送策略优化方法研究

全文直达

下载全文

在线阅读

引用

摘要：

基于深度强化学习算法在策略优化问题中的良好表现,以立体投送作战行动为主要研究对象,提出了一种深度强化学习框架与仿真推演实验协同的作战行动策略优化方法.在分析策略优化研究现状的基础上,根据研究问题对深度学习框架进行了分析比较,构建了基于A3C算法的深度强化学习立体投送策略模型,并通过仿真推演和分布式计算,实现深度强化学习模型与"人不在回路"仿真推演的交互学习,获得优化后的立体投送策略,验证了深度强化学习框架与仿真推演实验协同优化策略的有效性.

关键词：深度强化学习、仿真推演、策略优化、立体投送、A3C算法

所属期刊栏目：36

分类号：TP391.9(计算技术、计算机技术)

在线出版日期：2024-02-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：39-49

英文信息展示

期刊专题