10.3969/j.issn.1000-3428.2009.22.059
新的启发式Q学习算法
针对连续型强化学习问题,提出一种综合启发函数和评估函数的Q学习算法,利用启发函数加快学习速度,采用评估函数减少不必要的探索,提高学习效率.为了保证该算法的有效性,启发函数和评估函数根据Q函数进行计算.坦克大战游戏的仿真实验结果证明,该方法可以较大地提高Q学习的学习效率.
Q学习、启发函数、评估函数、网络游戏
35
TP181(自动化基础理论)
辽宁省自然科学基金资助项目"基于P2P的MMOG关键技术的研究"20052007;辽宁省教育厅攻关计划基金资助项目"网络游戏引擎及其相关技术的研究"2004D116
2010-01-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
173-175