10.3969/j.issn.1002-137X.2008.11.047
基于类权重的模糊不平衡数据分类方法
针对现有分类算法通常对不平衡数据挖掘表现出有偏性,即正类样本(通常是更重要的一类)的分类和预测性能差于负类样本的分类和预测性能,提出一种不平衡数据分类方法.该方法通过一个超球面将两类数据以最大分离比率分离,并且引入类权重因子和样本模糊隶属度,同时考虑了不同类的重要性和不同样本对该类的不同贡献,从而提高了不平衡数据中正类的分类和预测的性能以及整体的推广能力.分别在人造数据和UCI真实数据上进行了实验,结果验证了该方法的有效性.
不平衡数据、类加权、模糊隶属度、分类算法
35
TP1;O21
国家自然科学基金60574075;国家自然科学基金项目60703118
2009-02-10(万方平台首次上网日期,不代表论文的发表时间)
共4页
170-173