基于深度学习的工业视觉箱体字符识别与判断

引用

摘要：

工厂生产线上的商品包装外箱文本印刷存在残缺,无法及时检出会影响流通销售.制作工业商品外观信息数据集,提出基于深度学习的工业视觉箱体字符识别与匹配判断方法.合并YOLOv3中的卷积层和批量归一化层,引入GIoU作为边界框损失函数并设计自适应调整定位坐标的方法,优化在原始图像上进行文本检测定位的速度与精度.同时,训练并对比CRNN和Tesseract两种识别引擎在已裁剪文本图片上的识别性能,设计字符匹配方法判断字符识别正确与否并输出结果,从而减少误判.对基于该方法的系统进行生产线实测,实验结果表明,其识别准确率可达99.5％,单件商品的外观拍照、检测识别、输出结果耗时仅3 s左右,表明所提方法能够实现实时监测.

关键词：深度学习;YOLOv3算法;卷积递归神经网络;字符识别;外观信息;实时监测

所属期刊栏目：48

分类号：TP18(自动化基础理论)

资助基金：国家重点研发计划;国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;重庆市基础科学与前沿技术研究专项重点项目

在线出版日期：2022-01-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：296-304

英文信息展示

期刊专题