基于MapReduce的强连通网格聚类算法
随着位置大数据的爆炸式增长,传统的串行算法已无法对其进行高效地聚类处理,因此,基于MapReduce框架的并行聚类算法研究逐渐成为热点.聚类算法并行化后的聚类质量通常难以保证,因此对并行化聚类结果进行归约的方法极为重要.首先提出基于网格的改进DBSCAN并行化聚类算法,通过该步骤得到每个数据子集的聚类结果.然后在分析网格与簇的关系,定义网格簇和网格簇的连通、强连通概念的基础上,通过计算网格簇之间的连通权值矩阵,对具有强连通关系的网格簇进行归约,构成基于MapReduce的强连通网格聚类算法.该算法可实现位置大数据集的高效聚类.实验分析表明,基于MapReduce的强连通网格聚类算法对位置大数据的处理具有较高的效率和聚类质量.
位置大数据、网格、MapReduce、强连通、DBSCAN
46
TP274(自动化技术及设备)
浙江省基础公益研究计划项目GG19E090005
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
204-207,215