10.3969/j.issn.1000-3428.2008.19.001
基于后验概率的不平衡数据集特征选择算法
针对不平衡数据集,提出一种基于后验概率的特征选择算法.该算法引入基于Parzen-window方法估算的不均衡因子,并以Tomek links中点为初始值进行迭代,找出满足后验概率相等的判别边界点,通过对这些点法向量进行投影计算得到各特征的权值.实验表明,对于不平衡数据集,该算法在不降低分类器总体性能的基础上,不仅可以有效降低维度,节省计算开销,而且能够避免常规特征选择算法用于不平衡数据时忽视小类的缺点.
不平衡数据集、特征选择、后验概率
34
TP181(自动化基础理论)
国家部委基础研究基金;教育部重点科学研究基金资助项目105087;2004年教育部优秀人才支持计划基金资助项目NCET-04-0496;模式识别国家重点实验室开放课题基金;南京大学软件新技术国家重点实验室开放课题基金
2008-12-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
1-3