10.16526/j.cnki.11-4762/tp.2023.01.023
基于深度强化学习的移动机器人动态路径规划算法
为了在复杂舞台环境下使用移动机器人实现物品搬运或者载人演出,提出了一种基于深度强化学习的动态路径规划算法;首先通过构建全局地图获取移动机器人周围的障碍物信息,将演员和舞台道具分别分类成动态障碍物和静态障碍物;然后建立局部地图,通过LSTM网络编码动态障碍物信息,使用社会注意力机制计算每个动态障碍物的重要性来实现更好的避障效果;通过构建新的奖励函数来实现对动静态障碍物的不同躲避动作;最后通过模仿学习和优先级经验回放技术来提高网络的收敛速度,从而实现在舞台复杂环境下的移动机器人的动态路径规划;实验结果表明,该网络的收敛速度明显提高,在不同障碍物环境下都能够表现出好的动态避障效果.
移动机器人、LSTM、深度强化学习、动态路径规划、实时避障
31
TP311(计算技术、计算机技术)
国家自然科学基金;浙江省省属高校基本科研业务
2023-02-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
153-159,166