10.16208/j.issn1000-7024.2015.11.022
基于云计算平台的聚类算法
针对大数据的海量与高维特性,提出一种在云计算平台上基于MapReduce框架的距离三角不等式Canopy‐Kmeans并行聚类算法。利用三角不等式的原理减少计算冗余,提高原算法的执行速度。实验结果表明,该算法减少了I/O以及网络传输的消耗,克服了算法陷入局部最优解的缺点,使之能够充分利用集群的计算和存储能力对大数据进行聚类分析。
云计算、Canopy-Kmeans算法、三角不等式原理、大数据、并行
TP311(计算技术、计算机技术)
内蒙古自然科学基金项目2012MS0611
2015-11-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
2990-2994