空间认知导向下利用分层强化学习的最优路径规划
针对空间认知导向下模型驱动型路径规划和人们认知偏好多样性之间的矛盾,提出了一种基于分层强化学习的交互学习型路径规划方法。该方法将最优路径标准转换为路口处转向决策的瞬时奖励值,并通过预学习和实时学习两个阶段实现高效地发现总奖励值最大的最优路径策略。其中,预学习阶段自动发现子目标节点,并构建包含局部最优策略的子任务;实时学习阶段利用预定义策略实现高效的Q值更新,并根据Q值追溯最优路径。实验表明,该方法具有足够好的实时性和最优性。
空间认知、最优路径规划、分层强化学习、预学习、实时学习
37
P208(一般性问题)
国家自然科学基金重点资助项目40830530;国家自然科学基金资助项目60872132
2012-12-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
1271-1275,1320