10.3969/j.issn.1672-9870.2015.03.029
K-均值聚类算法的MapReduce模型实现
针对日益严峻的大数据处理时间长、执行速率低等问题,通过深入分析,提出了一种提高大规模数据聚类效率的方法。以K-均值聚类算法为原型,利用MapReduce模型在大规模数据处理方面的优势,对原有算法进行并行化改进,设计出一种基于Hadoop分布式云平台的K-均值聚类MapReduce模型。应用此模型,对淘宝用户仿真数据进行聚类试验,试验结果表明,对K-均值聚类算法的MapReduce模型实现后,性能优于原算法性能,缩短了聚类时间,提高了聚类效率,特别适于对海量数据进行聚类处理。
大数据、MapReduce模型、K-均值聚类算法
TP391(计算技术、计算机技术)
2015-07-31(万方平台首次上网日期,不代表论文的发表时间)
共5页
120-124