10.3778/j.issn.1002-8331.2106-0054
改进DDPG无人机航迹规划算法
针对无人机飞行过程存在未知威胁使智能算法处理复杂度高,导致航迹实时规划困难,以及深度强化学习中调整DDPG算法参数,存在时间成本过高的问题,提出一种改进DDPG航迹规划算法.围绕无人机航迹规划问题,构建飞行场景模型,根据飞行动力学理论,搭建动作空间,依据非稀疏化思想,设计奖励函数,结合人工蜂群算法,改进DDPG算法模型参数的更新机制,训练网络模型,实现无人机航迹决策控制.仿真结果表明,所提算法整体训练时长仅为原型算法单次平均训练时长的1.98倍,大幅度提升网络训练效率,降低时间成本,且在满足飞行实时性情况下,符合无人机航迹质量需求,为推动深度强化学习在航迹规划的实际应用提供新思路.
深度确定性策略梯度算法、无人机、航迹规划、深度强化学习、人工蜂群算法
58
TP273(自动化技术及设备)
国家重点实验室基金CEMEE2021G0001
2022-04-27(万方平台首次上网日期,不代表论文的发表时间)
共9页
264-272