10.16208/j.issn1000-7024.2018.01.022
基于余弦相似度的改进C4.5决策树算法
针对传统C4.5算法存在容易产生冗余规则、决策树规模过大、分类速度过慢等问题,提出一种基于余弦相似度的改进C4.5决策树算法.计算每个属性的信息熵和增益率,如果任意属性的任意两个属性值的信息熵之差在一个很小范围内时,计算两个属性值的余弦相似度;合并相似度在阈值范围内的属性值,重新计算合并后属性的信息增益率,依据传统的C4.5算法进行计算.抽取某医院普检数据进行仿真,仿真结果表明,所提算法能够有效降低分裂属性维度,缩减了决策树规模,减少了冗余规则,提高了分类速度.
数据挖掘、C4.5算法、余弦相似度、决策树、降维
39
TP301.6(计算技术、计算机技术)
山东省自然科学基金项目ZR2014FL019;山东省高等学校科技计划基金项目J14LN31
2018-04-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
120-125