一种优化初始点与自适应半径的密度聚类算法

引用

摘要：

传统DBSCAN算法不能正确聚类密度不均匀的数据集,聚类结果受邻域阈值和密度阈值参数的影响较大.提出一种新的优化初始点和自适应半径的密度聚类算法.利用反向最近邻和相似度矩阵发现当前全局密度最大的数据样本,分析该样本周围密度的分布情况,采用自适应的方法计算当前簇的邻域阈值,并利用DBSCAN算法进行聚类.在人工数据集和UCI数据集上进行测试的结果表明,与经典的DBSCAN、OPTICS、RNN-DBSCAN算法相比,优化初始点和自适应半径的密度聚类算法在ARI、NMI、Homogeneity、Completeness和V-measure 5个评价指标上整体取得最优值,其中在Compound、Jain等数据集上达到1.0,具有较高的聚类效率和准确度.

关键词：密度聚类;初始点优化;反向最近邻;自适应半径;相似度矩阵

所属期刊栏目：48

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金61962054

在线出版日期：2022-01-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：51-59

英文信息展示

期刊专题