10.3778/j.issn.1673-9418.2006060
结合自然和共享最近邻的密度峰值聚类算法
基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳.针对这些问题,提出一种密度峰值聚类改进算法.该算法结合了自然和共享最近邻算法,重新定义了截断距离和局部密度的计算方法,并且算法融合了候选聚类中心计算概念,通过算法选出不同的候选聚类中心,然后以这些候选中心为新的数据集,再次开始密度峰值聚类,最后将剩余的点分配到所对应的候选中心点所在类簇中.改进的算法在合成数据集和UCI数据集上进行验证,并与K-means、DBSCAN和DPC算法进行比较.实验结果表明,提出的算法在性能方面有明显提升.
密度峰值聚类算法、自然最近邻、共享最近邻
15
TP301(计算技术、计算机技术)
国家自然科学基金11671125,51707013
2021-05-12(万方平台首次上网日期,不代表论文的发表时间)
共10页
931-940