基于样本特性欠取样的不均衡支持向量机
针对传统支持向量机在数据失衡的情况下分类效果很不理想的问题,提出一种基于样本特性欠取样的不均衡SVM分类算法。该算法首先在核空间中依据样本信息量选择一定比例的靠近不均衡分类界面的多数类样本;然后根据样本密度信息选择最具有代表性的均衡多数类样本点,在减少多数类样本的同时使分类界面向多数类方向偏移。实验结果表明,所提出的算法与其他不均衡数据预处理方法相比,能有效提高SVM算法在失衡数据中少数类的分类性能、总体分类性能和鲁棒性。
不均衡数据、支持向量机、样本特性、欠取样
TP391(计算技术、计算机技术)
国家自然科学基金面上项目61074076;中国博士后科学基金项目20090450119;中国博士点新教师基金项目20092304120017;黑龙江省博士后基金项目LBH-Z08227
2013-07-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
978-984