10.3969/j.issn.1000-3428.2005.11.005
多步截断优先扫描强化学习算法
研究了优先扫描的强化学习方法,通过定义新的迹,把多步截断即时差分学习用于集成规划的优先扫描强化学习,用多步截断即时差分来定义扫描优先权,提出一种改进的优先扫描强化学习算法并进行仿真实验,实验结果表明,新算法的学习效率有明显的提高.
强化学习、优先扫描、多步截断、Markov过程
31
TP18(自动化基础理论)
广西自然科学基金桂科自0481016;广西工学院校科研和教改项目
2005-07-14(万方平台首次上网日期,不代表论文的发表时间)
共3页
13-15