10.3969/j.issn.1673-629X.2013.02.015
一种网格化聚类算法的MapReduce并行化研究
面对增量式增长的聚类数据,受云计算并行化处理模式的启发,文中对一种网格化聚类算法进行了MapReduce并行化研究.该算法首先利用网格处理技术对数据进行预处理,用网格预处理后所得单元的重心点取代该单元中保存的所有点,然后在MapReduce框架下将各个单元的重心点作为聚类分析的基本数据单元,进行聚类分析.实验结果表明,该算法MapReduce并行化后部署在Hadoop集群上运行,具有与原来相同的聚类效果,并能节省聚类分析的时间和降低计算的复杂度,适合用于高纬度、增量式的海量数据的分析和挖掘.
网格、聚类、数据挖掘、MapReduce并行化
TP31(计算技术、计算机技术)
2013-03-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
60-64