10.3969/j.issn.1671-4598.2014.05.061
基于云计算的并行K-means聚类算法研究
目前数据呈爆炸式增长,海量存储状态,给聚类研究带来了诸如计算复杂性和计算能力不足都很多问题;而云计算平台通过负载均衡,动态配置大量的虚拟计算资源,有效地突破了耗时耗能的瓶颈,在海量数据挖掘中体现出了其独特的优势;文章深入研究了基于云计算平台Hadoop的并行K-means算法,并结合MapReduce分布式计算模型,给出了算法设计的方法和策略,包括MapReduce处理的map、shuffle和Reduce 3个过程,仿真结果表明K-means并行算法的效率较高.
云计算技术、Hadoop、MapReduce、K-means算法
22
TP311(计算技术、计算机技术)
南京工程学院校级科研重点基金QKJA2011011;江苏省属高校自然科学基金11KJB510005;国家自然科学基金61104085
2015-01-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
1510-1512