10.3969/j.issn.2095-2163.2018.06.008
基于抽样和最大最小距离法的并行K-means聚类算法
随着网络技术的发展和社会信息化进程的加快,数据规模迅速增长,传统的聚类算法很难满足海量数据的分析处理需求.针对目前K-means聚类算法处理海量数据时存在聚类效果不稳定、准确率不高等问题,本文基于MapReduce模型,采用抽样技术和最大最小距离法,在此基础上提出一种高效的并行K-means聚类算法.选用UCI数据集进行实验,结果表明该算法的收敛速度、聚类精度,以及在处理海量数据时的并行性能都得到了提高.
MapReduce模型、K-means算法、抽样、最大最小距离法
8
TP312(计算技术、计算机技术)
山西省教育科学“十三五”规划课题GH-17100;山西大学商务学院科研项目2017011;山西大学商务学院教改课题SYJ201711
2018-11-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
37-39,43