最近最远得分的聚类性能评价指标
聚类算法是数据分析中广泛使用的方法之一,而类别数往往是决定聚类算法性能的关键.目前,大部分聚类算法需要预先给定类别数,在很多情况下,很难根据数据集的先验知识获得有效的类别数.因此,为了获得数据集的类别数,本文基于最近邻一致性和最远邻相异性的准则,提出了一种最近最远得分评价指标,并在此基础上提出了一种自动确定类别数的聚类算法.实验结果证明了所提评价指标在确定类别数时的有效性和可行性.
最近邻一致性、最远邻相异性、K-means聚类算法、评分机制、评价指标、层次聚类
12
TP391(计算技术、计算机技术)
国家自然科学基金"重点"项目61532005
2017-05-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
67-74