10.3969/j.issn.1000-3428.2014.04.028
基于双层网格和密度的数据流聚类算法
传统的基于网格的数据流聚类算法在同一粒度的网格上进行聚类,虽然提高了处理速度,但聚类准确性较低.针对此问题,提出一种新的基于双层网格和密度的数据流聚类算法DBG-Stream.在2种粒度的网格上对数据流进行聚类,并借鉴CluStream 算法的思想,将聚类过程分为2个阶段.在线过程中利用粗粒度的网格单元形成初始聚类,离线过程中在细粒度网格单元上,对位于簇边界的网格单元进行二次聚类以提高聚类精度,并实现了关键参数的自动设置,通过删格策略提高算法效率.实验结果表明,DBG-Stream算法的聚类精确度较D-Stream算法有较大提高,有效解决了传统基于网格聚类算法的聚类精度较低的问题.
数据挖掘、数据流、聚类、聚类分析、密度、双层网格
40
TP311(计算技术、计算机技术)
国家自然科学基金资助项目“西部国家重点生态功能区生态安全预警和仿真调控研究”71263045
2014-06-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
146-150