10.19678/j.issn.1000-3428.0059680
基于深度学习的工业视觉箱体字符识别与判断
工厂生产线上的商品包装外箱文本印刷存在残缺,无法及时检出会影响流通销售.制作工业商品外观信息数据集,提出基于深度学习的工业视觉箱体字符识别与匹配判断方法.合并YOLOv3中的卷积层和批量归一化层,引入GIoU作为边界框损失函数并设计自适应调整定位坐标的方法,优化在原始图像上进行文本检测定位的速度与精度.同时,训练并对比CRNN和Tesseract两种识别引擎在已裁剪文本图片上的识别性能,设计字符匹配方法判断字符识别正确与否并输出结果,从而减少误判.对基于该方法的系统进行生产线实测,实验结果表明,其识别准确率可达99.5%,单件商品的外观拍照、检测识别、输出结果耗时仅3 s左右,表明所提方法能够实现实时监测.
深度学习;YOLOv3算法;卷积递归神经网络;字符识别;外观信息;实时监测
48
TP18(自动化基础理论)
国家重点研发计划;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;重庆市基础科学与前沿技术研究专项重点项目
2022-01-13(万方平台首次上网日期,不代表论文的发表时间)
共9页
296-304