DOI：10.3969/j.issn.1000-3428.2014.10.010

MapReduce模型下的模糊C均值算法研究

引用

摘要：

针对模糊C均值算法需要不断迭代来计算样本数据的隶属度值以及聚类中心的特点，利用MapReduce模型解决海量数据下的模糊C均值问题，进而提出高效的模糊C均值算法。在Map阶段和Reduce阶段分别完成隶属度和聚类中心的计算，每次迭代都需要启动一次完整的MapReduce执行过程。通过多次迭代计算出隶属度值以及聚类中心，并更新聚类中心文件，供下一轮作业使用，重复执行这一过程直至得到最终聚类结果。实验结果表明，该算法能够有效减少MapReduce计算过程中的迭代次数，从而提高整体执行效率。

关键词：模糊C均值算法、MapReduce模型、海量数据、高效、迭代

分类号：TP391.41(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60903082;辽宁省教育厅基金资助项目L2012113。

在线出版日期：2014-10-31（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：47-51

英文信息展示

期刊专题