一种可重叠子空间K-Means聚类算法

引用

摘要：

现有聚类算法面向高维稀疏数据时多数未考虑类簇可重叠和离群点的存在,导致聚类效果不理想.为此,提出一种可重叠子空间K-Means聚类算法.设计类簇子空间计算策略,在聚类过程中动态更新每个类簇的属性子空间,并定义合理的约束函数指导聚类过程,从而实现类簇的可重叠性与离群点的控制.在此基础上定义合理的目标函数对传统K-Means算法进行修正,利用熵权约束分别计算每个类簇中各维度的权重,使用权重值标识不同类簇中维度的相对重要性,并加入控制重叠程度和离群值数量的参数.在人工数据集和真实数据集上的实验结果表明,该算法在NMI、F1指标上均优于EWKM、NEO-K-Means、OKM等子空间聚类算法,具有更好的聚类结果.

关键词：目标函数、子空间聚类、离群点、熵权约束、K-Means聚类算法

所属期刊栏目：46

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金;广西可信软件重点实验室研究课题;广西多源信息挖掘与安全重点实验室开放基金;西北师范大学2019年度青年教师科研能力提升计划重大项目

在线出版日期：2020-09-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：58-63,71

英文信息展示

期刊专题