10.3969/j.issn.1002-137X.2011.10.039
面向属性值遗漏数据决策树分类算法研究
在已有的多种决策树测试属性选择方法中,来见将属性值遗漏数据处理集成在测试属性选择过程中的报道,而现有的属性值遗漏数据处理方法都会不同程度地带入偏置.基于此,提出了一种将基于联合熵的信息增益率作为决策树测试属性选择标准的方法,用以在生成决策树的过程中消除值遗漏数据对测试属性选择的影响.在WEKA机器平台上进行了对比实验,结果表明,改进算法能够从总体上提高算法的执行效率和分类精度.
属性值遗漏数据、联合熵、决策树
38
TP311(计算技术、计算机技术)
国家自然科学基金70971059;辽宁省创新团队项目2009T045;辽宁省科技攻关项目2007308003
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
174-176