10.3969/j.issn.1000-3428.2015.08.028
基于协议组降低策略的二次并行k均值聚类算法
针对传统MapReduce框架下多点接口通信时间复杂度过高的问题,提出一种二次并行k均值聚类算法,用于解决大数据聚类问题.采用组降低操作策略,定义组成员管理协议对操作组成员进行管理,通过对组成员的参考列表plD的广播、删除和添加操作,实现基于组降低的同步操作.定义中间缓冲聚类数量并结合k均值算法,减少二次并行聚类算法组降低操作的输入数据量,进一步降低算法的时间复杂度.在自建大数据测试集上的仿真实验结果表明,该算法能够在保证聚类精度的前提下有效加快算法聚类效率.
协议组降低、并行、k均值聚类算法、大数据、MapReduce模型
41
TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目61303234,61263022
2015-10-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
150-155