10.3969/j.issn.1007-130X.2015.08.006
基于满二叉树的二分K-means聚类并行推荐算法
在推荐系统中应用K-means算法聚类可有效降维,然而聚类效果往往依赖于选定的初始中心,并且一旦选定目标簇后,推荐过程只针对目标簇进行,与其他簇无关.针对上述两个问题,提出一种基于满二叉树的二分K-means聚类并行推荐算法.该算法首先反复迭代二分K-means算法,迭代过程中使用簇内凝聚度作为分裂阈值,形成一颗满二叉树;然后通过层次遍历将用户归入到K个叶子节点(簇);最后针对K个簇,应用MapReduce框架进行并行推荐预测.MovieLens上的实验结果表明,该算法可大幅度提高推荐系统准确性,同时增强系统可扩展性.
满二叉树、K-means、聚类、推荐算法、MapReduce
37
TP311(计算技术、计算机技术)
广东省教育部产学研结合项目2012B091100003,2012B091000058;广东省专业镇中小微企业服务平台建设项目2012B040500034
2015-09-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
1450-1457