聚类有效性研究综述
聚类是一个无监督学习过程,因此确定最佳聚类数是一项困难的工作.聚类有效性研究是通过建立聚类有效性指标,评价聚类质量并确定最佳聚类数的过程.首先,介绍了聚类的数学描述和聚类有效性指标的分类;然后,基于指标构成成分的不同,分别评述了12个仅考虑数据集几何结构信息的聚类有效性指标、6个仅考虑隶属度的聚类有效性指标以及9个同时考虑数据集几何结构信息和隶属度的聚类有效性指标,分析了不同类型指标的研究现状;接着,简要总结了外部性指标和稳定性指标等其他聚类有效性指标的研究现状;最后,总结并展望了聚类有效性研究面临的挑战和发展方向.
聚类、聚类有效性、聚类有效性指标、最佳聚类数
34
TP18(自动化基础理论)
国家高技术研究发展计划863计划2011AA05A116;国家自然科学基金71131002,71071045,71201042
2014-11-17(万方平台首次上网日期,不代表论文的发表时间)
2417-2431