DOI：10.3969/j.issn.1000-7024.2014.02.057

基于MapReduce模型的并行遗传k-means聚类算法

引用

摘要：

为了提高遗传k-means算法时间效率和聚类结果的正确率,利用遗传算法的粗粒度并行化设计思想,提出了在Hadoop平台下将遗传k-means算法进行并行化设计.将各个子种群编号作为个体区分,个体所包含的各个聚类中心和其适应度作为值共同作为个体的输入;在并行化过程中,设计了较优的种群迁移策略来避免早熟现象的发生.实验对不同的数据集进行处理,实验结果表明,并行化的遗传k-means算法在处理较大数据集时比传统的串行算法在时间上和最后的结果上都具有明显的优越性.

关键词：遗传算法、k-means算法、MapReduce模型、Hadoop平台、并行化

所属期刊栏目：35

分类号：TP312(计算技术、计算机技术)

资助基金：安徽省教育厅自然科学研究基金重点项目2011A006

在线出版日期：2014-04-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：657-660

英文信息展示

期刊专题