10.3969/j.issn.1002-2279.2021.01.011
基于区域扩张策略的势场强化学习算法路径规划研究
未知连续环境状态下的Q学习路径规划算法在执行对环境的试错时收敛速度慢,容易陷入局部,不利于对真实未知环境的探索,为解决此问题,针对Q学习路径规划问题提出一种基于Metropolis准则的区域扩张策略的势场强化学习算法.算法为环境提供势场先验知识初始化状态信息,消除初始时刻的盲目性,提高学习效率,同时引入基于Metropolis准则的区域扩张陷阱区域剔除探索,剔除陷阱障碍物环境的凹形区域.通过MATLAB对多种环境的仿真实验,验证了算法有效性.
Q学习、Metropolis准则、势场强化学习、探索区域扩张、MATLAB仿真
42
TP301.6;TP242.6(计算技术、计算机技术)
2021-03-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
47-51