10.3969/j.issn.1672-9722.2016.05.011
基于启发函数改进的SARSA(λ)算法
强化学习是一种重要的机器学习方法,在机器人路径规划,智能控制等许多决策问题中取得了成功的应用,已经成为机器学习研究的一个重要分支.针对强化学习存在着的收敛慢,学习知识慢,探索与利用平衡等问题,论文对SARSA(λ)算法提出了一种改进,改进的方法借助经验知识从环境特征中提出一个用于策略择优和优化回报函数的启发函数,以此来加速算法的收敛速度.通过仿真对比,论文提出改进算法具有比SARSA(λ)更快的奖赏反馈,表明了该算法在知识学习方面的有效性.
强化学习、SARSA(λ)、启发函数、评估学习
44
TP301.6(计算技术、计算机技术)
2016-07-26(万方平台首次上网日期,不代表论文的发表时间)
共4页
825-828