DOI：10.3969/j.issn.1000-1220.2013.08.020

面向不平衡数据的特征加权聚类算法

引用

摘要：

不平衡数据集类别分布严重倾斜,传统的聚类算法由于以提高整体学习性能为目标,往往偏向于聚集多数类,而忽视更有价值的稀有类.本文提出一种基于迭代的特征加权聚类算法,根据当前聚类后簇的特点以及特征重要性度量函数确定特征权值,利用所得权值进行下一轮聚类,直到权值稳定后结束迭代.在多个UCI不平衡数据集上的实验效果表明,本文算法能够较好地识别出重要特征并提高它们的权重,避免聚类算法过度偏向多数类,有效地提高了聚类性能.

关键词：不平衡数据、一趟聚类、特征加权

所属期刊栏目：34

分类号：TP309(计算技术、计算机技术)

资助基金：国家自然科学基金项目61070061;广州市科技计划项目2011J5100004;广州市越秀区科技计划项目2012-TP-005

在线出版日期：2013-11-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：1809-1812

英文信息展示

期刊专题