10.3969/j.issn.1000-3428.2015.01.038
基于距离度量学习的集成谱聚类
无监督学习聚类算法的性能依赖于用户在输入数据集上指定的距离度量,该距离度量直接影响数据样本之间的相似性计算,因此,不同的距离度量往往对数据集的聚类结果具有重要的影响.针对谱聚类算法中距离度量的选取问题,提出一种基于边信息距离度量学习的谱聚类算法.该算法利用数据集本身蕴涵的边信息,即在数据集中抽样产生的若干数据样本之间是否具有相似性的信息,进行距离度量学习,将学习所得的距离度量准则应用于谱聚类算法的相似度计算函数,并据此构造相似度矩阵.通过在UCI标准数据集上的实验进行分析,结果表明,与标准谱聚类算法相比,该算法的预测精度得到明显提高.
数据挖掘、边信息、相似度矩阵、距离度量学习、谱聚类、UCI数据集
41
TP18(自动化基础理论)
山西省软科学基金资助项目2009041052-03
2015-03-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
207-210,244