旋翼无人机在移动平台降落的控制参数自学习调节方法
无人机设备能够适应复杂地形,但由于电池容量等原因,无人机无法长时间执行任务.无人机与其他无人系统(无人车、无人船等)协同能够有效提升无人机的工作时间,完成既定任务,当无人机完成任务后,将无人机迅速稳定地降落至移动平台上是一项必要且具有挑战性的工作.针对降落问题,文中提出了基于矫正纠偏 COACH(corrective advice communicated humans)方法的深度强化学习比例积分微分(proportional-integral-de-rivative,PID)方法,为无人机降落至移动平台提供了最优路径.首先在仿真环境中使用矫正纠偏框架对强化学习模型进行训练,然后在仿真环境和真实环境中,使用训练后的模型输出控制参数,最后利用输出参数获得无人机位置控制量.仿真结果和真实无人机实验表明,基于矫正纠偏COACH方法的深度强化学习PID方法优于传统控制方法,且能稳定完成在移动平台上的降落任务.
自主降落、强化学习、路径规划、COACH框架、确定性策略梯度、空地协同、无人机、最优控制
17
TP273+.2(自动化技术及设备)
国家自然科学基金;中央高校基本科研业务费项目
2022-10-14(万方平台首次上网日期,不代表论文的发表时间)
共10页
931-940