10.3969/j.issn.1001-8360.2011.09.011
基于关键度度量的决策树算法改进及其在铁路运输中的应用
采用决策树方法对客票数据及行车安全数据进行分析时,发现在训练数据集的主类类属分布不平衡的情况下,无法对数据量占相对少数的小类属数据进行描述,究其原因在于现有决策树方法的节点类标号标示采用的是“多数表决”的方式.为此,本文提出关键度度量的概念,用于改进决策树的叶节点竞争机制,旨在改进决策树方法在解决弱势类属在数据建模分析中公平获得“发言权”的问题.算例表明,这种改进较好地解决了偏类数据集的数据分析问题.
数据挖掘、决策树、关键度度量
33
U285.49(铁路通信、信号)
铁道部科技研究开发计划2008X015-G
2012-01-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
62-67