无人机反应式扰动流体路径规划
针对复杂三维障碍环境,提出一种基于深度强化学习的无人机(Unmanned aerial vehicles,UAV)反应式扰动流体路径规划架构.该架构以一种受约束扰动流体动态系统算法作为路径规划的基本方法,根据无人机与各障碍的相对状态以及障碍物类型,通过经深度确定性策略梯度算法训练得到的动作网络在线生成对应障碍的反应系数和方向系数,继而可计算相应的总和扰动矩阵并以此修正无人机的飞行路径,实现反应式避障.此外,还研究了与所提路径规划方法相适配的深度强化学习训练环境规范性建模方法.仿真结果表明,在路径质量大致相同的情况下,该方法在实时性方面明显优于基于预测控制的在线路径规划方法.
无人机、反应式路径规划、受约束扰动流体动态系统、深度强化学习、训练环境
49
TP18;TP242;TP301.6
国家自然科学基金;国家自然科学基金;国家自然科学基金
2023-03-08(万方平台首次上网日期,不代表论文的发表时间)
共16页
272-287