10.13718/j.cnki.xsxb.2020.06.015
基于改进近邻传播算法的聚类质量评价模型
针对近邻传播(Affinity Propagation,简称AP)算法在对非团状数据集聚类过程中出现的局部聚类较多、精准度不高等问题,提出了一种基于改进AP算法的聚类质量评价模型.首先,在AP算法初步聚类的基础上,通过合并相似度较大的簇,减小聚类上限值kmax,进一步压缩聚类区间范围;其次,给出一个新的内部评价指标,用分属不同簇的样本对的平均距离代表簇间距离,削弱噪声数据的影响,平衡簇间分离度与簇内紧致度的关系.在UCI和KDD CUP99数据集上的实验结果表明,新模型可以给出精准的最优聚类数(范围),能够在保持较低漏报率的同时,有效提高样本的检测率和分类正确率.
聚类评价指标、近邻传播、内部评价指标、最优聚类数
45
TP301.6(计算技术、计算机技术)
广东省教育科学规划课题2018GXJK339
2020-07-01(万方平台首次上网日期,不代表论文的发表时间)
共10页
97-106