基于密度的统计合并聚类算法
针对现有聚类算法处理噪声能力差和速度较慢的问题,提出了一种基于密度的统计合并聚类算法( DSMC).该算法将数据点的每一个特征看作一组独立随机变量,根据独立有限差分不等式得出统计合并判定准则;同时,结合数据点的密度信息,把密度从大到小的排序作为凝聚过程中的合并顺序,实现了各类数据点的统计合并. 人工数据集和真实数据集的实验结果表明,DSMC算法不仅可以处理凸状数据集,对于非凸、重叠、加入噪声的数据集也有良好的聚类效果,充分表明了该算法的适用性和有效性.
数据点、密度、随机变量、合并、聚类、噪声
10
O235;TP311(控制论、信息论(数学理论))
国家自然科学基金资助项目61103058
2015-12-11(万方平台首次上网日期,不代表论文的发表时间)
共10页
712-721