10.3969/j.issn.1000-1220.2013.08.020
面向不平衡数据的特征加权聚类算法
不平衡数据集类别分布严重倾斜,传统的聚类算法由于以提高整体学习性能为目标,往往偏向于聚集多数类,而忽视更有价值的稀有类.本文提出一种基于迭代的特征加权聚类算法,根据当前聚类后簇的特点以及特征重要性度量函数确定特征权值,利用所得权值进行下一轮聚类,直到权值稳定后结束迭代.在多个UCI不平衡数据集上的实验效果表明,本文算法能够较好地识别出重要特征并提高它们的权重,避免聚类算法过度偏向多数类,有效地提高了聚类性能.
不平衡数据、一趟聚类、特征加权
34
TP309(计算技术、计算机技术)
国家自然科学基金项目61070061;广州市科技计划项目2011J5100004;广州市越秀区科技计划项目2012-TP-005
2013-11-05(万方平台首次上网日期,不代表论文的发表时间)
共4页
1809-1812