10.3969/j.issn.1000-3428.2003.05.016
一种基于状态聚类的SARSA(λ)强化学习算法
为求解大状态空间的强化学习问题,提出了一种基于状态聚类的SARSA(λ)强化学习算法,其基本思想是利用先验知识或事先训练控制器,对状态空间进行聚类,分为不同的簇,然后在簇空间上进行sARsA(λ)学习.若能进行适当的状态聚类,算法将可得到一个相对好的近似值函数.
强化学习、函数近似、状态聚类、SARSA学习
29
TP18(自动化基础理论)
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
37-38,98