10.16208/j.issn1000-7024.2015.05.018
CART决策树的两种改进及应用
利用Fayyad边界点判定原理对CART决策树选取连续属性的分割阈值的方法进行改进,由Fayyad边界点判定原理可知,建树过程中选取连续属性的分割阈值时,不需要检查每一个分割点,只要检查样本排序后,该属性相邻不同类别的分界点即可;针对样本集主类类属分布不平衡时,样本量占相对少数的小类属样本不能很好地对分类进行表决的情况,采用关键度度量的方法进行改进。基于这两点改进构建CART分类器。实验结果表明,Fayyad边界点判定原理适用于CART算法,利用改进后的CART算法生成决策树的效率提高了近45%,在样本集主类类属分布不平衡的情况下,分类准确率也略有提高。
决策树、CART算法、分割阈值、Fayyad边界点判定定理、关键度度量
TP301.6(计算技术、计算机技术)
国家973重点基础研究发展计划基金项目2013CB328903-2
2015-05-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
1209-1213