10.3969/j.issn.1000-1220.2021.10.010
一种通过强化学习的四旋翼姿态控制算法
本文提出通过深度强化学习实现四旋翼姿态控制.通过对深度强化学习中的近端策略优化实现姿态稳定的控制学习任务.飞行器直接通过神经网络进行训练,直接将状态输入映射到控制输出.其次提出一种崭新的算法通过将传统的控制模型引入来提高强化学习算法的训练速度.经过实验验证,该算法可以有效控制四旋翼在任意姿态下的稳定性,且该算法可以在比一般强化学习方法更具泛用性更快收敛.
深度强化学习;四旋翼无人机;自然梯度下降;姿态控制
42
TP24(自动化技术及设备)
国家自然科学基金项目61573246
2021-10-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
2074-2078