10.3969/j.issn.1004-731X.2005.07.044
自主移动机器人中基于强化学习的噪声消解策略
基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响.提出了一种基于过程奖赏和优先扫除(PS-process)的强化学习算法作为噪声消解策略.针对典型的觅食任务,以计算机仿真为手段.并与其它四种算法--基于结果奖赏和优先扫除(PS-result)、基于过程奖赏和Q学习(Q-process)、基于结果奖赏和Q学习(Q-result)和基于手工编程策略(Hand) 进行比较.研究结果表明比起其它四种算法,本文所提出的基于过程奖赏和优先扫除的强化学习算法能有效降低噪声的影响,提高了系统整体性能.
移动机器人、噪声、过程奖赏、优先扫除、强化学习
17
TP242(自动化技术及设备)
2005-08-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
1699-1703