10.3969/j.issn.1000-3428.2011.13.047
一种基于欠采样的不平衡数据分类算法
针对不平衡数据学习问题,提出一种基于欠采样的分类算法.对多数类样例进行欠采样,保留位于分类边界附近的多数类样例.以AUC为优化目标,选择最恰当的邻域半径使数据达到平衡,利用欠采样后的样例训练贝叶斯分类器,并采用AUC评价分类器性能.仿真数据及UCI数据集上的实验结果表明,该算法有效.
机器学习、分类算法、不平衡数据、欠采样、邻域
37
TP181(自动化基础理论)
国家科技支撑计划基金资助项目2006BAK01A33;公安部重点科研基金资助项目B类20032252001;吉林省科技发展计划基金资助项目20070321,20090704
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)
共3页
147-149