10.3969/j.issn.1000-3428.2013.09.018
基于MapReduce的K-means聚类集成
针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验结果表明,该算法能够有效地改善聚类质量,具有良好的扩展性,适用于海量数据的聚类分析。
海量数据、聚类、MapReduce框架、K-means算法、共协关系矩阵、聚类集成
TP311(计算技术、计算机技术)
国家自然科学基金资助项目60873100;山西省自然科学基金资助项目2010011022-1
2013-11-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
84-87