10.3969/j.issn.1002-137X.2012.z2.036
一种基于Hadoop云计算平台的聚类算法优化的研究
随着信息技术的飞速发展,需要处理的数据量急剧增长,聚类算法的研究面临着海量数据分析和处理的挑战.对K-means聚类算法的优化进行了深入的研究,提出了首先选定初始聚类中心的并行K-means聚类算法.对不同大小的数据集进行测试实验,证明该优化算法具有更好的时间性、正确性和稳定性,适合于海量数据的分析和处理.
云计算、Hadoop平台、并行K-means、MapReudce、初始化聚类中心
39
TN9;TP3
2013-01-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
115-118