10.3969/j.issn.1000-7024.2013.12.046
基于分类规则的C4.5决策树改进算法
为解决大样本数据条件下C4.5决策树算法需要训练集常驻内存、分类精度达不到需求以及如何选取最优分类规则等问题,提出了一种基于分类规则选取的C4.5决策树改进算法.通过数次有放回的随机抽取训练集形成多个分类规则,在多次分类规则内寻找特征的最优取值以建立最优分类规则,以划分相似度为标准进行C4.5决策树最优特征选取,在此基础上利用选定的最优分类规则和最优特征对C4.5决策树算法进行改进.实验结果表明,改进后的算法可有效解决C4.5决策树与初始训练集相关性较大的问题,对大样本数据集的分类识别在识别率上有显著提高,训练时间明显减少.
C4.5决策树、分类规则、属性度量、划分相似度、特征选取
34
TP391.4(计算技术、计算机技术)
国家863高技术研究发展计划基金项目2011AA010603、2011AA010605
2014-01-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
4321-4325,4330