10.3969/j.issn.1003-6059.2014.05.008
基于仿射传播的进化数据流在线聚类算法
为提高数据流聚类的精度和时效性,提出一种具有时态特征与近邻传播思想的高效数据流聚类算法( TCAPStream)。该算法利用改进的WAP将新检测到的类模式合并到聚类模型中,同时利用微簇时态密度表征数据流的时态演化特征,并提出在线动态删除机制对微簇进行维护,使算法模型既能体现数据流的时态特征,又能反映数据流的分布特性,得到更精确的聚类结果。实验结果表明,该算法在多个人工数据集和真实数据集上不仅具有良好的聚类效果,而且具有较好的伸缩性和可扩展性。
数据挖掘、近邻传播聚类、时态密度、模型重建、数据流
TP181(自动化基础理论)
国家高技术研究发展863计划项目2011AA010603,2011AA010605
2014-07-02(万方平台首次上网日期,不代表论文的发表时间)
共9页
443-451