新的启发式Q学习算法

引用

摘要：

针对连续型强化学习问题,提出一种综合启发函数和评估函数的Q学习算法,利用启发函数加快学习速度,采用评估函数减少不必要的探索,提高学习效率.为了保证该算法的有效性,启发函数和评估函数根据Q函数进行计算.坦克大战游戏的仿真实验结果证明,该方法可以较大地提高Q学习的学习效率.

关键词：Q学习、启发函数、评估函数、网络游戏

所属期刊栏目：35

分类号：TP181(自动化基础理论)

资助基金：辽宁省自然科学基金资助项目"基于P2P的MMOG关键技术的研究"20052007;辽宁省教育厅攻关计划基金资助项目"网络游戏引擎及其相关技术的研究"2004D116

在线出版日期：2010-01-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：173-175

英文信息展示

期刊专题