10.3969/j.issn.1007-757X.2015.10.008
基于类标签变化的改进SLIQ算法研究
针对数据挖掘的决策树分类技术中,SLIQ分类器在建树阶段寻找最佳分裂属性时,需要计算大量数值型属性间中间值的基尼系数,算法时间效率低的问题,提出一种改进的SLIQ算法。该算法通过判断数值型属性的预排序属性表中的类标签变化来选择合适分裂位置,减少可能存在的最佳分裂点。实验部分中,用UCI机器学习库中的数据集作分类测试。与原来的SLIQ算法相比,在没有降低分类准确率与扩大决策树规模的情况下,需要计算基尼系数的分裂点个数平均减少了36.32%。最后,将改进算法应用于电子商务的客户分析,分类结果有助于商家作出正确决策。
数据挖掘、决策树、分类、SLIQ算法、分裂点
TP301.6(计算技术、计算机技术)
云南省高校商务智能科技创新团队42212217010
2015-11-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
27-31