10.3979/j.issn.1673-825X.202109300346
一种无先验地图的移动机器人导航方法
为了提高移动机器人在复杂环境下的无先验地图导航算法模型训练速度及导航成功率,提出一种基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)的移动机器人导航方法.利用2D激光雷达的均匀分布测距信息,降低环境噪声的干扰及高维度环境信息的计算量;采用人工势场法构建移动机器人从初始位置到目标点过程的奖励函数;通过Actor-Critic网络结构提高模型训练的稳定性和泛化能力.实验结果表明,提出的方法具有模型训练速度快、导航成功率高及泛化能力强等优点.
移动机器人导航、深度强化学习、奖励函数、人工势场
35
TN953;TP242.6
国家自然科学基金;重庆市基础科学与前沿技术研究
2023-05-06(万方平台首次上网日期,不代表论文的发表时间)
共8页
360-367