10.16798/j.issn.1003-0530.2017.04.011
结合朴素贝叶斯和欧氏距离的二类非均衡数据集成方法
随着数据挖掘技术的发展,传统集成方法中的集成规则,例如Max rule,Min rule,Product rule,以及Sumrule,已经不能满足现实中对于二类非均衡数据分类正确率的需要.因此本文提出了基于朴素贝叶斯和欧氏距离的二类非均衡数据集成方法.该集成方法是以朴素贝叶斯为基分类器,其集成规则通过引入测试数据与训练数据之间的欧式距离以及训练数据中多数类与少数类之间的关系,在空间距离上加强了最终的分类结果与原始训练数据之间的关联性.实验结果表明,该集成方法在处理二类非均衡数据时,Area Under roc Curve (AUC)值与现存的集成方法相比显著提高,从而具有更好的分类性能.因此,本文方法在处理二类非均衡数据时具有明显优势.
二类非均衡数据、集成方法、欧氏距离、朴素贝叶斯
33
TP18(自动化基础理论)
国家自然科学基金61271240,61671253;江苏省高校自然科学基金重大项目16KJA510004;江苏省优势学科发展计划;东南大学移动通信国家重点实验室开放研究基金2016D01;南京邮电大学宽带无线通信与传感网技术教育部重点实验室开放研究基金NYKL201509
2017-06-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
528-532