10.3969/j.issn.1673-4785.201411036
CMP 上基于数据集划分的 K-means 多核优化算法
虽然现在多核CPU非常普及,但传统K-means聚类算法由于没有专门进行并行化设计,不能充分利用现代CPU的多核计算能力,算法针对大规模数据集的聚类效率有待进一步提高。因此,对K-means算法进行CMP并行化改进,提出了一种Multi-core K-means( MC-K-means)算法。该算法对K-means的聚类任务进行了分解,设计了独立且均衡的聚类子任务并分配给各线程并行执行,以此利用现代CPU 的多核计算能力。实验结果表明,MC-K-means相比K-means获得了较高的多核加速比,提高了针对大规模数据集的聚类能力。
K均值算法、聚类算法、单片多核、大规模数据集、数据挖掘、无监督学习、大数据
TP181(自动化基础理论)
国家自然科学基金资助项目71271117;国家科技支撑计划基金资助项目2010BAI88B00;江苏省自然科学基础研究计划基金资助项目 BK2010331;江苏省博士研究生创新计划基金资助项目CX10B_016X;江苏省博士后科研资助计划项目1401056C ;江苏大学高级人才基金资助项目13JDG127.
2015-09-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
607-614