DOI：10.16208/j.issn1000-7024.2022.08.033

基于YOLOv3与CRNN的自然场景文本识别

引用

摘要：

在自然场景中对中英文文本的检测与识别受限于图像本身包含的噪声数据,为提高检测识别效率,提出基于YOLOv3与CRNN的自然场景文本识别方法.进行文本角度预测,根据角度预测值旋转图像;采用YOLOv3文本区域检测算法计算若干组固定宽度的文本框;使用聚类算法将这些固定宽度的文本框连接成一个包含完整语义的文本框;采用CRNN算法识别文本检测框中的文本.实验结果表明,YOLOv3与CRNN模型识别100幅图像用时0.4258 s,在同等实验环境中CTPN与DenseNet模型用时0.8250 s,验证了YOLOv3与CRNN模型比CTPN与DenseNet模型具有更高的识别效率.

关键词：深度学习、文字识别、自然场景、卷积递归神经网络、文字角度预测

所属期刊栏目：43

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金;广西自然科学基金项目;广西自然科学基金项目

在线出版日期：2022-08-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：2352-2360

英文信息展示

期刊专题