一类基于启发式搜索的激励学习算法
激励学习已被证明是在控制领域中一种可行的新方法.相比其他的方法,它能较好地处理未知环境问题,但它仍然不是一种有效的方法.幸运的是,在现实世界中,智能体总是会有一些环境的先验知识,这些能形成启发式信息.启发式搜索是一种常用的搜索方法,有很快的搜索速度,但需要精确的启发式信息,这在有些时候难以得到.文中分析比较了启发式搜索和激励学习的各自特点,提出一类新的基于启发式搜索的激励学习算法,初步的实验结果显示了较好的性能.
启发式搜索、激励学习、启发式SARSA
16
TP301.6(计算技术、计算机技术)
2006-08-30(万方平台首次上网日期,不代表论文的发表时间)
共3页
41-43