10.19554/j.cnki.1001-3563.2020.21.037
非均衡训练集过采样的印刷套准识别方法
目的 针对印刷标志图像训练数据集非均衡性导致印刷标志图像中少类数据套准状态识别准确率低的问题,提出改进的SMOTE训练集过采样方法,以提高少类数据的识别准确率.方法 提取印刷标志图像灰度行程矩阵的纹理特征,组成多维的模型输入特征数据.基于少类样本的邻域信息,得到少类样本的过采样参数.对少类样本采取不同的过采样策略,实现训练集样本的均衡.使用均衡的训练集建立支持向量机模型,实现对印刷套准状态的识别.结果 实验结果表明,文中方法在不同非均衡印刷数据集上,获得的平均分类准确率几何平均数Gmean为0.8507,召回率Re为0.7192,ROC曲线下面积A为0.8549.结论 文中方法在不同非均衡印刷套准数据集上的分类性能要优于实验中的SMOTE,IS和SVM等方法.
非均衡数据、印刷套准、灰度行程矩阵、过采样
41
TP391.4(计算技术、计算机技术)
广东省信息物理融合系统重点实验室项目;广东工业大学青年基金重点项目
2020-11-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
251-260