10.3969/j.issn.1001-8360.2018.02.009
基于不平衡文本数据挖掘的铁路信号设备故障智能分类
针对铁路信号设备不平衡故障文本数据,提出基于文本挖掘的铁路信号设备故障智能分类模型.采用TF-IDF模型实现电务信号设备故障文本的特征提取并转换为向量,基于Voting的方式实现多分类器集成学习分类.该模型利用SVM-SMOTE算法对TF-IDF转换后的小类别文本向量数据进行随机生成,采用逻辑回归、朴素贝叶斯、SVM等基分类器和GBDT、随机森林集成分类器对平衡后的数据进行分类,考虑不同分类器的适用特点,通过Voting方式进行多分类器集成学习.通过对某铁路局2012—2016年铁路信号设备故障文本数据进行试验分析,表明该模型可使故障分类的准确率、召回率和F-score均得到显著提升.
铁路信号设备、故障分类、不平衡文本数据、SMOTE、基分类器、集成分类器、集成学习
40
U284(铁路通信、信号)
中国铁道科学研究院院基金重大课题2017YJ005,2017YJ006
2018-03-13(万方平台首次上网日期,不代表论文的发表时间)
共8页
59-66