10.3969/j.issn.1000-1220.2018.04.004
融合物品热门因子的协同过滤改进算法
协同过滤算法是推荐系统中比较古老的算法,原理是根据近邻用户或者相似物品对目标进行推荐,因此相似度计算方法是关键部分.由于互联网的高传播性,物品热门周期变短,影响了用户之间相似性度量,传统的协同过滤算法已经不能达到很好的推荐效果.针对相似度改进,在皮尔逊相似度原理上添加物品热门因子,优化皮尔逊相似度计算,提高推荐效果.采用大数据技术并搭建spark分布式平台.在spark大数据平台上使用MovieLens电影推荐数据集上验证改进后的算法,采用准确率、召回率和平均绝对误差(MAE)等指标来评价改进算法.实验结果表明改进算法在准确率和召回率上都比传统算法有很大的提高,在平均绝对误差上也有所下降.
协同过滤、皮尔逊相似度、MovieLens数据集、spark平台、热门因子
39
TP391(计算技术、计算机技术)
国家自然科学基金项目61472256、61170277;上海市教委科研创新重点项目12zz137;沪江基金项目C14002
2018-04-24(万方平台首次上网日期,不代表论文的发表时间)
共6页
638-643