基于海量搜索历史数据的用户兴趣模型
针对互联网搜索引擎环境中,基于海量搜索历史数据分析用户兴趣的问题,提出一种改进的用户兴趣模型。该模型根据用户搜索的历史数据,结合向量空间模型( VSM )和TF-IDF算法,递归地回溯出用户兴趣权重列表。为解决用户兴趣变化和时间性能的问题,该模型引入时间遗忘机制进行动态更新,并在Hadoop分布式系统架构下利用MapReduce分布式编程模型进行实现。实验结果表明,改进的用户兴趣模型的查准率和召回率都能达到50',具有较好的可行性和可用性。
向量空间模型、TF-IDF、Hadoop、MapReduce、用户兴趣模型
TP391.1(计算技术、计算机技术)
东华大学励志计划项目B201312。
2014-12-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
126-129,139