10.3969/j.issn.1000-1220.2013.11.007
三层流数据聚类框架与最优2k近邻聚类算法
面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人为摸索.针对这些不足和流数据环境普遍采用的两层聚类框架,提出了基于微簇优化的三层流数据聚类框架,并在此基础上提出了基于最优2k近邻的流数据聚类算法.该算法的在线层不断地凝聚微簇的密集状态,优化微簇并自适应地调整微簇半径,而离线聚类层还利用先验聚类结果调整聚类参数.实验结果表明,所提出的算法提高了流数据聚类的稳定性、精确性和可扩展性,具有良好的聚类效果.
流数据、框架、聚类、微簇
34
TP391(计算技术、计算机技术)
水利部公益性行业科研专项201001031
2013-12-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
2451-2455