10.19678/j.issn.1000-3428.0060683
基于强化学习的路径规划技术综述
路径规划作为移动机器人自主导航的关键技术,主要是使目标对象在规定范围内找到一条从起点到终点的无碰撞安全路径.阐述基于常规方法和强化学习方法的路径规划技术,将强化学习方法主要分为基于值和基于策略两类,对比时序差分、Q-Learning等基于值的代表方法与策略梯度、模仿学习等基于策略的代表方法,并分析其融合策略和深度强化学习方法方法的发展现状.在此基础上,总结各种强化学习方法的优缺点及适用场合,同时对基于强化学习的路径规划技术的未来发展方向进行展望.
路径规划;强化学习;深度强化学习;移动机器人;自主导航
47
TP242(自动化技术及设备)
国家自然科学基金;深圳科技计划基础研究项目
2021-10-19(万方平台首次上网日期,不代表论文的发表时间)
共10页
16-25