10.16208/j.issn1000-7024.2016.05.029
C4.5算法的优化
对传统C 4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的 GINI 指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为 G_ C 4.5。对G_C 4.5、传统C 4.5算法与其它改进算法进行对比实验分析,分析结果表明, G_ C 4.5算法在分类效率和准确性上都有一定提高。
C4.5 算法、泰勒级数、等价无穷小、GINI指数的均值、非类属性间关联性、G_C4.5 算法
37
TP311.5(计算技术、计算机技术)
2016-07-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
1265-1270,1361