10.3969/j.issn.1673-629X.2017.07.006
基于标签匹配的协同过滤推荐算法研究
随着微博用户数量的上升,微博信息量成倍增长,基于冗杂的微博信息向微博用户快速推荐感兴趣的好友是不容回避的技术问题.针对这一问题,基于微博大数据,以Hadoop为平台,HBase为基础,MapReduce为编程框架,提出了基于Apriori算法与Item-based协同过滤算法的组合算法,并构建了推荐好友系统.该系统通过Apriori算法对冗杂的微博内容记录进行频繁项集的计算,得出能表达用户喜好的标签,以提升系统的时间性能;通过Item-based算法对标签进行匹配推荐,以缩短系统的推荐时间以及资源占用率.为了验证所构建系统的有效性和可靠性,分别进行了两组对比实验,第一组实验为添加了Apriori算法的协同过滤算法与传统协同过滤算法在时间性能方面的对比测试,第二组实验则为Apriori算法混合Item-based协同过滤算法与混合K-means算法的对比测试.实验结果表明,在庞大的微博容量下,与传统协同过滤算法相比,所提出算法的运行时间缩短了24%~44%;与混合K-means聚类算法相比,所提出算法在算法运行时间和CPU占用率均有1.2~1.5倍的提升.可见,提出的算法可显著缩短推荐时间,减少资源消耗率,提高推荐效率.
协同过滤算法、标签计算、Hadoop、MapReduce、标签匹配
27
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目61562086,61462079,61363083,61262088;新疆"万人计划"后备项目wr2015bj01
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
25-28