10.3969/j.issn.1000-3428.2004.04.017
强化学习中的时间差分法在用户学习方面的应用
随着Internet上信息量的与日俱增,用户查找自己感兴趣的信息变得越来越困难.文章提出了一种使用强化学习中的时问差算法来学习用户的新学习算法,并通过实验与其它学习方法作了比较,取得了明显的成效.
强化学习、时间差分法、用户Agent、用户模型、向量表示
30
TP301(计算技术、计算机技术)
国家重点基础研究发展计划973计划G1998030414;山西省自然科学基金20031038;教育部科学技术研究项目03020
2004-03-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
40-41,124