基于阶段Q学习算法的机器人路径规划

引用

摘要：

针对传统Q学习存在收敛速度慢、学习效率低等问题,提出一种基于阶段Q学习的机器人路径规划算法.首先基于环境规模设置每阶段探索步长,减少搜索重复度;其次设置奖励池和奖励阈值确保每一阶段为最优探索;最后组合阶段最优路径为全局最优路径.通过仿真实验表明,与传统Q学习算法相比,阶段Q学习算法提高了学习效率,提升算法的收敛速度,使得机器人在复杂环境中能够迅速找到无碰撞路径.

关键词：强化学习、机器人、路径规划、Q学习、分阶段最优探索

所属期刊栏目：43

分类号：TP301(计算技术、计算机技术)

资助基金：山东省自然科学基金ZR2020MF090

在线出版日期：2022-07-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：197-203

英文信息展示

期刊专题