10.3321/j.issn:1002-0446.2000.05.008
基于CVRL的移动机器人导航控制
针对移动机器人的导航问题,本文提出一种具有连续向量输出的再励学习算法(Reinforcement Learning with Continuous Vector output:CVRL).CVRL具有层次结构,低层是单元动作网络层,通过组合动作产生连续向量输出;高层是建立在组合单元动作空间上的Q学习单元,实现组合动作的选择.文中给出了CVRL导航控制器的具体实现,并通过仿真实验验证了其有效性.
导航、具有连续向量输出的再励学习、层次结构、组合动作
22
TP24(自动化技术及设备)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
377-383