基于云计算平台Hadoop的并行k-means聚类算法设计研究
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等.深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略.在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘.
云计算、Hadoop平台、并行k-means、MapReduce
38
TP301.6;G4;TQ028.8
国家自然科学基金;国家重点基础研究发展计划(973计划);西北师范大学青年教师科研能力提升计划骨干项目;湖南省教育厅一般项目
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
166-168,176