10.3778/j.issn.1673-9418.2111138
去中心化加权簇归并的密度峰值聚类算法
快速搜索和寻找密度峰值聚类算法(DPC)是近年来提出的一种基于密度的聚类算法,具有原理简单、无需迭代并能实现任意形状聚类的优点.但该算法仍存在一些缺陷:围绕聚类中心点聚类,使聚类结果受中心点影响显著,且聚类中心点数量仍需人为指定;截断距离仅考虑了数据的分布密度,忽略了数据的内部特征;聚类过程中若有样本存在分配错误,会导致其后续样本聚类出现跟随错误.针对上述问题,尝试提出一种去中心化加权簇归并的密度峰值聚类算法(DCM-DPC).该算法引入权重系数重新定义了局部密度,并由此划分出位于不同局部高密度区域的核心样本组,用于取代聚类中心点成为聚类的依据.最后将剩余样本按其近邻样本所在类簇的众数,或分配到最高耦合的核心样本组代表的类簇中或标注为离散点以完成聚类.在人工和UCI数据集上的实验结果表明,提出算法的聚类效果优于对比算法,对相互纠缠的类簇的边界样本划分也更加精确.
密度峰值、聚类、去中心点、邻域、簇归并
16
TP301(计算技术、计算机技术)
教育部产学合作协同育人项目;四川省科技厅重点研发项目
2022-08-22(万方平台首次上网日期,不代表论文的发表时间)
共13页
1910-1922