基于强化学习补偿的地面无人战车行进间跟瞄自适应控制
针对底盘运动和路面起伏对地面无人战车行进间跟瞄带来的非线性干扰问题,提出一种基于强化学习补偿的地面无人战车行进间跟瞄自适应控制方法.该跟瞄控制方法由主控制器与补偿控制器两部分构成,主控制器利用PID控制算法结合当前跟瞄误差得到主控制量,补偿控制器利用Dueling Q网络强化学习算法对战车当前状态和局部规划路径附近的路面起伏信息进行处理得到补偿控制量.建立地面无人战车一体化运动学模型,对基于强化学习的补偿控制算法进行阐述;基于V-REP动力学软件在三维场景中进行仿真验证.实验结果表明:基于强化学习补偿的跟瞄控制方法对底盘运动和路面起伏具备较好的自适应能力,有效地提升了无人战车行进间跟瞄的准确性与稳定性.
地面无人战车、行进间跟瞄、强化学习、自适应控制、补偿控制
43
TJ810.2(战车、战舰、战机、航天武器)
武器装备预先研究项目301060701
2022-09-05(万方平台首次上网日期,不代表论文的发表时间)
共9页
1947-1955