不均衡故障诊断数据上的特征选择
不均衡数据在实际应用中广泛存在,它们已对机器学习领域构成了一个挑战,如何有效处理不均衡数据也成为目前的一个新的研究热点.在故障诊断数据集中,故障样本数通常比非故障样本数要少很多,由此引发了数据不均衡问题下故障诊断的问题.以往的研究很少关注这种数据不均衡问题对故障诊断的影响.此外,在故障数据集中有一些冗余甚至是不相关的特征,这些特征降低了学习器的泛化能力.为解决这类问题,提出了一种基于嵌入式特征选择的EasyEnsemble算法来解决故障诊断中的数据不均衡问题.在UCI数据集和柴油发动机数据集上的实验结果表明新算法提高了分类器在不均衡数据集上的分类性能和预报能力.
特征选择、不均衡数据集、集成学习、故障诊断、柴油发动机
30
TP311(计算技术、计算机技术)
国家自然科学基金项目20503105,60873129;上海市科委创新行动计划重大项目07DZ19726;上海市青年科技启明星计划项目08QA1403200;上海高校选拔培养优秀青年教师科研专项基金项目sdj-07003
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
924-927