10.3969/j.issn.1001-6600.2007.04.013
基于可疑实例影响度分析改进的C4.5 rules算法
决策树学习算法是数据挖掘中一类经典的分类算法.传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量.在此提出基于可疑实例影响度分析改进的C4.5 rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测.算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果.将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能.
数据挖掘、决策树、可疑实例、影响度度量
25
TP18(自动化基础理论)
安徽省自然科学基金050420207
2007-12-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
51-54