10.3969/j.issn.1004-132X.2022.01.010
面向不平衡数据集的汽车零部件质量预测
针对汽车零部件质检数据存在合格品与不合格品数量不平衡的问题,提出了基于密度聚类与多工序制造特征的MCDC-MF-SMOTE质检数据过采样方法.先对少数类(不合格)与多数类(合格)样本分别进行密度聚类,再对多工序制造数据和类簇样本分布进行过采样权重计算;根据设定的过采样比和类簇权重,在少数类簇中进行过采样数据生成.使用MCDC-MF-SMOTE过采样方法生成汽车零部件质检的平衡数据集,并采用随机森林排序制造特征的重要性,对分类模型LightGBM、XGBoost、SVM和MNB进行Stacking集成来预测不合格品.与随机抽检相比,该方法对不合格产品的检出率提高了约63%.
数据不平衡;质量预测;密度聚类;集成学习
33
TP182(自动化基础理论)
国家重点研发计划;国家自然科学基金
2022-01-19(万方平台首次上网日期,不代表论文的发表时间)
共9页
88-96