10.3969/j.issn.1000-1220.2021.02.019
结合LSTM的强化学习动态环境路径规划算法
在路径规划领域已经涌现出了诸多的优秀的经典算法,但这些传统方法往往基于静态环境,对于动态可变环境缺乏处理能力.本文提出一种结合LSTM强化学习动态环境路径规划算法.首先,本文以环境图像作为输入,最大限度了保证了原始的信息来源.而后构建了自动编码器用来对环境图像进行特征降维,降低了整体模型的复杂程度.最后采用深度强化学习算法DDPG进行路径规划,其中Actor部分采用LSTM的网络构建,使Actor在决策时可以参考前序信息,做到有预测的避开动态障碍.最后通过实验证明了本文算法的可行性和高效性.
自动编码器、LSTM、DDPG、强化学习、动态路径规划
42
TP391(计算技术、计算机技术)
山东省自然科学基金项目ZR2017BF043
2021-03-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
334-339