数据分布不敏感的决策树算法
传统的决策树算法是数据分布敏感的,面对数据分布偏斜的样本集时,常导致少数类别样本的分类精度很低.已有的可以处理偏斜样本集的决策树算法只针对两种类别样本的集合.由此提出了一种新的数据分布不敏感的决策树算法--DTID.该算法通过构造各种新的少数类别样本,调整样本集合的数据分布,提高少数类别样本的分类精度.DTID算法采用样本取模运算减少了算法的运行时间.实验结果表明,与C4.5等算法相比,DTID的分类精度明显提高,即使样本集中包含多种少数类别样本也能获得较好的分类效果.
人工智能、决策树算法、偏斜样本集、调整数据分布、样例的模
39
TP18(自动化基础理论)
国家科技支撑计划项目2006BAK01A33;吉林省科技发展计划项目20090704
2016-05-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
1607-1611