一种基于密度的空间数据流在线聚类算法
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理人规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有 4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033 ms.
空间数据挖掘、聚类数据流、基于密度的聚类、在线算法、噪声处理
38
TP311.13(计算技术、计算机技术)
国家高技术研究发展计划863计划2011AA040101;国家自然科学基金61172049;61003251;教育部博士点基金20100006110015
2012-08-13(万方平台首次上网日期,不代表论文的发表时间)
1051-1059