基于深度Q网络学习的机器人端到端控制方法
为了提高机器人在没有障碍物地图或者激光雷达数据稀疏情况下进行无碰撞运动的准确性,将强化学习与深度学习方法融合,提出了一种基于深度Q网络学习的机器人端到端控制方法.首先,利用传统Q学习方法进行强化学习,生成大量的有标签数据样本;然后,利用深度神经网络构建从激光雷达数据输入到机器人运动速度输出的端到端控制模型,该模型由输入层、输出层和两个全连接层组成;最后,在仿真环境中完成了模型的训练和评估,并将其部署在机器人平台上测试.实验结果表明,该方法训练生成的模型有效地建立了激光雷达数据与机器人运动速度之间的映射关系,按照这种映射关系,机器人在每一个控制周期选择Q值最大的动作执行,能运动平顺地规避障碍物.
深度强化学习、深度Q网络、端到端、无碰撞运动
39
TH39(泵)
国防科技创新特区项目17-163-11-ZD-001-001-03;国家自然科学基金重点支持91748211
2019-05-13(万方平台首次上网日期,不代表论文的发表时间)
共8页
36-43