10.3969/j.issn.1000-1220.2013.01.011
不平衡数据的无监督特征选择方法
传统特征选择方法大部分是以分布均衡的数据为研究对象,以优化总体分类精度为基本目标,所以很少有方法在不平衡数据集上得到理想的学习效果.依据数据的分布特点,提出一种新的面向不平衡数据集的特征选择方法.该方法在无监督环境下,依据聚类簇大小的变化以通过在不同簇的相同特征上对其特征重要性度量函数分配不同的权重来调整数据分布的不均衡性.在多个UCI不平衡数据集上的实验结果表明,相比于其它几种经典的特征选择方法,所提出的方法在不降低总体分类精度的情况下,不仅可以有效选择更少的特征数目,而且还可以提高少数类在不同分类器上的分类精度、召回率及F-Measure值.
特征选择、不平衡数据集、聚类、特征重要性度量
34
TP391(计算技术、计算机技术)
国家自然科学基金项目61070061;教育部人文社会科学研究青年项目11YJCZH086;广东外语外贸大学青年项目11Q01;广东省高层次人才项目资助
2013-05-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
63-67