基于MapReduce的K_means并行算法及改进

万方数据知识服务平台

点击收藏，不怕下次找不到~

举报应用

@万方数据

期刊专题

基于MapReduce的K_means并行算法及改进

引用

收藏

摘要：

针对传统k_means聚类算法在处理海量数据时所面临的内存不足、运算速度慢等问题，提出了一种基于MapReduce的K_means并行算法，同时为了改善k_means算法在初始值确定方面的盲目性，采用canopy算法进行改进。实验结果表明，基于MapReduce的K_means并行算法和改进后的算法均能产生良好的聚类效果，不仅提高了聚类质量，而且在处理大数据集方面，改进后的算法的还能够得到趋近于线性的加速比。

关键词：MapReduce、k-means算法、canopy算法、并行计算、聚类

在线出版日期：2015-06-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：188-192

英文信息展示

相关文献

评论

暂无封面信息

查看本期封面目录

计算机系统应用

ISSN：1003-3254

CN：11-2854/TP

年，卷(期)：2015，(6)

相关作者

相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助课题编号：2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司津ICP备20003920号-1

信息网络传播视听节目许可证许可证号：0108284

网络出版服务许可证：(总)网出证(京)字096号

违法和不良信息举报电话：4000115888 举报邮箱：problem@wanfangdata.com.cn

举报专区：https://www.12377.cn/

客服邮箱：op@wanfangdata.com.cn