10.3969/j.issn.1002-137X.2011.10.037
基于云计算平台Hadoop的并行k-means聚类算法设计研究
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等.深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略.在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘.
云计算、Hadoop平台、并行k-means、MapReduce
38
TP3;TN9
国家自然科学基金60933004,60975039,61072085;国家973项目2007CB311004;西北师范大学青年教师科研能力提升计划骨干项目NWNU-LKQN-10-1;湘潭大学博士启动基金10QDZ42;湖南省教育厅一般项目09C967
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
166-168,176