10.13718/j.cnki.xsxb.2016.11.026
数据挖掘中的属性选择偏差抑制算法研究
决策树算法广泛应用于数据挖掘领域之中.属性选择是决策树方法挖掘效率的关键,但ID3方法和C4.5方法在选择属性时,都会产生一定程度的选择偏差.据此,该文对信息增益模型进行了改进,将多次对数运算的信息熵求取过程简化为多值求和,从而规避了属性选择出现偏差的可能性,也加快了决策树构建的执行速度.依托学生情况数据展开的实验研究表明,与经典的ID3方法相比,该文方法构建的决策树更加简洁.同时,随着数据样本数量的增大,该文方法的执行时间大为降低.
数据挖掘、决策树、属性选择、偏差抑制
41
TP391(计算技术、计算机技术)
广西自然科学基金青年基金项目2014GXNSFBA118283
2017-03-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
160-164