DOI：10.3969/j.issn.1000-1220.2012.10.032

基于留一交叉验证的类不平衡危害预评估策略

引用

摘要：

近年来,类不平衡问题已逐渐成为人工智能、机器学习和数据挖掘等领域的研究热点,目前已有大量实用有效的方法.然而,近期的研究结果却表明,并非所有的不平衡数据分类任务都是有害的,在无害的任务上采用类不平衡学习算法将很难提高,甚至会降低分类的性能,同时可能大幅度增加训练的时间开销.针对此问题,提出了一种危害预评估策略.该策略采用留一交叉验证法(LOOCV,Leave-one-out cross validation)测试训练集的分类性能,并据此计算一种称为危害测度(HM,Harmful-ness Measure)的新指标,用以量化危害的大小,从而为学习算法的选择提供指导.通过8个类不平衡数据集对所提策略进行了验证,表明该策略是有效和可行的.

关键词：类不平衡、留一交叉验证、危害测度、预评估

所属期刊栏目：33

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61105057;江苏科技大学引进人才科研启动项目35301002

在线出版日期：2013-01-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：2287-2292

英文信息展示

期刊专题