10.3778/j.issn.1673-9418.1603046
有效距离在聚类算法中的应用
聚类分析是数据挖掘领域的重要组成部分之一,而度量学习是聚类分析中的关键性步骤.传统聚类算法中通常使用欧氏距离进行距离度量,但是欧氏距离只关注两两样本之间的距离关系,并没有顾及数据的全局性分布结构.考虑到数据的全局性结构信息,提出了一种新的具有全局性的度量方法——有效距离度量(effective distance metric),其主要思想是通过稀疏重构的方法计算数据样本之间的有效距离.进一步地,将有效距离应用到K-means、K-medoids和FCM(fuzzy C-means)3种经典聚类算法中开发了3种基于有效距离的聚类算法,即EK-means,EK-medoids和EFCM聚类算法.通过与传统聚类算法在UCI标准数据集上的实验结果进行比较,验证了基于有效距离的聚类算法能显著提高聚类效果.
聚类、距离度量、度量学习、有效距离
11
TP181(自动化基础理论)
The National Natural Science Foundation of China under Grant Nos. 61422204, 61473149;the Open Founda-tion of Graduate Innovation Center in NUAA under Grant No. kfjj20151605
2017-04-12(万方平台首次上网日期,不代表论文的发表时间)
共8页
406-413