基于密度的优化数据流聚类算法
为了解决数据流聚类算法中有效处理离群点这一关键问题,改进了基于密度的数据流聚类算法,在DenStream算法基础上提出了具有双检测时间策略DDTS(double derection time strategy)的基于密度的数据流聚类算法.该策略在数据流流速波动的情况下,结合时间与流数据数量两方面因素对微簇进行测试.通过在线动态维护和删减微簇,保存可能升级的离群点来改善聚类效果.实验结果表明,改进算法具有良好的适用性和有效性,能够取得较高的聚类质量.
数据流、聚类、密度、双检测时间策略、数据挖掘
31
TP311(计算技术、计算机技术)
国家863高技术研究发展计划基金项目2008AA011001
2011-01-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
4756-4759