基于改进高斯核度量和KPCA的数据聚类新方法

引用

摘要：

大多数超椭球聚类(hyper-ellipsoidal clustering,HEC)算法都使用马氏距离作为距离度量,已经证明在该条件下划分聚类的代价函数是常量,导致HEC无法实现椭球聚类.本文说明了使用改进高斯核的HEC算法可以解释为寻找体积和密度都紧凑的椭球分簇,并提出了一种实用HEC算法-K-HEC,该算法能够有效地处理椭球形、不同大小和不同密度的分簇.为实现更复杂形状数据集的聚类,使用定义在核特征空间的椭球来改进K-HEC算法的能力,提出了EK-HEC算法.仿真实验证明所提出算法在聚类结果和性能上均优于K-means算法、模糊C-means算法、GMM-EM算法和基于最小体积椭球(minimum-volume ellipsoids,MVE)的马氏HEC算法,从而证明了本文算法的可行性和有效性.

关键词：数据聚类、超椭球聚类、最小体积椭球、核主成分分析、高斯核

所属期刊栏目：26

分类号：TP3;TP1

在线出版日期：2017-12-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：150-155

英文信息展示

期刊专题