聚类有效性评价新指标
聚类有效性评价指标分为外部评价指标和内部评价指标两大类.现有外部评价指标没有考虑聚类结果类偏斜现象;现有内部评价指标的聚类有效性检验效果难以得到最佳类簇数.针对现有内外部聚类评价指标的缺陷,提出同时考虑正负类信息的分别基于相依表和样本对的外部评价指标,用于评价任意分布数据集的聚类结果; 提出采用方差度量类内紧密度和类间分离度,以类间分离度与类内紧密度之比作为度量指标的内部评价指标.UCI数据集和人工模拟数据集实验测试表明,提出的新内部评价指标能有效发现数据集的真实类簇数;提出的基于相依表和样本对的外部评价指标,可有效评价存在类偏斜与噪音数据的聚类结果.
聚类、聚类有效性、评价指标、外部指标、内部指标、F-measure、AdjustedRandIndex、STDI、S2、PS2
12
TP108(自动化基础理论)
国家自然科学基金项目61673251;陕西省科技攻关项目2013K12-03-24;陕西师范大学研究生创新基金项目2015CXS028,2016CSY009;中央高校基本科研业务费重点项目GK201701006
2018-01-22(万方平台首次上网日期,不代表论文的发表时间)
共10页
873-882