基于阶段Q学习算法的机器人路径规划
针对传统Q学习存在收敛速度慢、学习效率低等问题,提出一种基于阶段Q学习的机器人路径规划算法.首先基于环境规模设置每阶段探索步长,减少搜索重复度;其次设置奖励池和奖励阈值确保每一阶段为最优探索;最后组合阶段最优路径为全局最优路径.通过仿真实验表明,与传统Q学习算法相比,阶段Q学习算法提高了学习效率,提升算法的收敛速度,使得机器人在复杂环境中能够迅速找到无碰撞路径.
强化学习、机器人、路径规划、Q学习、分阶段最优探索
43
TP301(计算技术、计算机技术)
山东省自然科学基金ZR2020MF090
2022-07-01(万方平台首次上网日期,不代表论文的发表时间)
共7页
197-203