决策树ID3算法的分析与改进
为了弥补ID3算法[1-3]的缺点及不足,设计了一种基于ID3算法的改进算法.它使用修正参数修正信息增益,克服了ID3算法偏向于选择取值较多的属性这一缺点,对连续值的属性进行离散化,解决了连续属性的处理问题,通过有未知值的样本是按照已知值的相对频率随机分布的思想,可以处理缺少属性值的样本.描述了通过改进的ID3算法生成决策树[4]的具体步骤,将改进算法应用到了客户关系管理系统中的客户流失分析问题当中.通过对实验结果的分析比较,得到改进算法与原ID3算法相比具有更高的预测准确率,表明了该算法的有效性.
数据挖掘、决策树、ID3算法、聚类、剪枝
32
TP301.6(计算技术、计算机技术)
2012-01-14(万方平台首次上网日期,不代表论文的发表时间)
共5页
3069-3072,3076