10.3969/j.issn.1000-1220.2012.10.032
基于留一交叉验证的类不平衡危害预评估策略
近年来,类不平衡问题已逐渐成为人工智能、机器学习和数据挖掘等领域的研究热点,目前已有大量实用有效的方法.然而,近期的研究结果却表明,并非所有的不平衡数据分类任务都是有害的,在无害的任务上采用类不平衡学习算法将很难提高,甚至会降低分类的性能,同时可能大幅度增加训练的时间开销.针对此问题,提出了一种危害预评估策略.该策略采用留一交叉验证法(LOOCV,Leave-one-out cross validation)测试训练集的分类性能,并据此计算一种称为危害测度(HM,Harmful-ness Measure)的新指标,用以量化危害的大小,从而为学习算法的选择提供指导.通过8个类不平衡数据集对所提策略进行了验证,表明该策略是有效和可行的.
类不平衡、留一交叉验证、危害测度、预评估
33
TP391(计算技术、计算机技术)
国家自然科学基金项目61105057;江苏科技大学引进人才科研启动项目35301002
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
2287-2292