DOI：10.3321/j.issn:1002-0446.2000.05.008

基于CVRL的移动机器人导航控制

引用

摘要：

针对移动机器人的导航问题，本文提出一种具有连续向量输出的再励学习算法(Reinforcement Learning with Continuous Vector output：CVRL)．CVRL具有层次结构，低层是单元动作网络层，通过组合动作产生连续向量输出；高层是建立在组合单元动作空间上的Q学习单元，实现组合动作的选择．文中给出了CVRL导航控制器的具体实现，并通过仿真实验验证了其有效性．

关键词：导航、具有连续向量输出的再励学习、层次结构、组合动作

所属期刊栏目：22

分类号：TP24(自动化技术及设备)

在线出版日期：2004-01-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：377-383

英文信息展示

期刊专题