10.11925/infotech.2096-3467.2017.0889
一种截断距离和聚类中心自适应的聚类算法
[目的]研究一种新的聚类算法,以改进密度峰值聚类算法无法自动计算截断距离以及需要人工参与选择聚类中心的不足.[方法]首先提出一种基于信息熵的截断距离自适应算法,实现了DPC算法截断距离的自适应;然后根据排序图中权值的斜率变化趋势确定拐点,自动划分出聚类中心与非聚类中心的界限,实现聚类中心的自动选择.[结果]通过在UCI数据集与人工数据集上的仿真实验,对DBSCAN算法、DPC算法、DGCCD算法、ACP算法与ADPC算法进行聚类性能的比较,结果表明ADPC算法不仅能够自动选择截断距离与聚类中心,在准确率、标准互信息(NMI)、F-measure值等性能上也有较大的提升,同时证明了改进算法在处理移动终端定位数据上的有效性.[局限]主要针对低维度数据集,面对高维度数据集略显乏力,同时未能兼顾处理大数据集时的效率问题.[结论]ADPC算法能够准确选择聚类中心和截断距离,对于低维度、任意形状簇的处理效果良好.
聚类、截断距离、斜率变化、ADPC
2
TP391(计算技术、计算机技术)
国家自然科学基金项目“动态数据挖掘的构造性机器学习方法研究”项目61273302的研究成果之一
2018-06-07(万方平台首次上网日期,不代表论文的发表时间)
共10页
39-48