结合自然和共享最近邻的密度峰值聚类算法

引用

摘要：

基于快速搜索和寻找密度峰值聚类算法(DPC)具有无需迭代且需要较少参数的优点,但其仍然存在一些缺点:需要人为选取截断距离参数;在流形数据集上的处理效果不佳.针对这些问题,提出一种密度峰值聚类改进算法.该算法结合了自然和共享最近邻算法,重新定义了截断距离和局部密度的计算方法,并且算法融合了候选聚类中心计算概念,通过算法选出不同的候选聚类中心,然后以这些候选中心为新的数据集,再次开始密度峰值聚类,最后将剩余的点分配到所对应的候选中心点所在类簇中.改进的算法在合成数据集和UCI数据集上进行验证,并与K-means、DBSCAN和DPC算法进行比较.实验结果表明,提出的算法在性能方面有明显提升.

关键词：密度峰值聚类算法、自然最近邻、共享最近邻

所属期刊栏目：15

分类号：TP301(计算技术、计算机技术)

资助基金：国家自然科学基金11671125,51707013

在线出版日期：2021-05-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：931-940

英文信息展示

期刊专题