10.19678/j.issn.1000-3428.0059770
一种优化初始点与自适应半径的密度聚类算法
传统DBSCAN算法不能正确聚类密度不均匀的数据集,聚类结果受邻域阈值和密度阈值参数的影响较大.提出一种新的优化初始点和自适应半径的密度聚类算法.利用反向最近邻和相似度矩阵发现当前全局密度最大的数据样本,分析该样本周围密度的分布情况,采用自适应的方法计算当前簇的邻域阈值,并利用DBSCAN算法进行聚类.在人工数据集和UCI数据集上进行测试的结果表明,与经典的DBSCAN、OPTICS、RNN-DBSCAN算法相比,优化初始点和自适应半径的密度聚类算法在ARI、NMI、Homogeneity、Completeness和V-measure 5个评价指标上整体取得最优值,其中在Compound、Jain等数据集上达到1.0,具有较高的聚类效率和准确度.
密度聚类;初始点优化;反向最近邻;自适应半径;相似度矩阵
48
TP18(自动化基础理论)
国家自然科学基金61962054
2022-01-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
51-59