DOI：10.3969/j.issn.1673-629X.2017.11.022

基于卷积神经网络的自然场景中数字识别

引用

摘要：

从复杂的图片背景中提取文本信息一直是计算机视觉中的热点与难点问题.近年来,随着卷积神经网络在图像识别研究的突破性进展,传统的人工提取图像特征方式逐渐为深层网络学习特征方式所取代,而应用卷积神经网络(CNN)的场景文本识别方法也越来越受到广泛的关注.为此,提出了自然场景下基于卷积网络结构的数字识别改进方法.该方法能够对目标区域进行检测,并进行端到端的数字字符识别训练,数字识别部分提取的特征还可用来初始化目标检测的网络部分,以减少特征的重复提取并提高训练速度.需要处理的图像输入无需固定格式,只需输入原始图像即可,可减少图像预处理过程及其对原始图像数据的不良影响,提高图像识别的精度.基于谷歌街景数据集(SVHN)与MSRA-TD500、ICDAR 2013数据集的数字字符识别验证结果表明,该方法的识别效果优于其他已有的识别方法.

关键词：卷积神经网络、自然场景、数字识别、端到端

所属期刊栏目：27

分类号：TP301(计算技术、计算机技术)

资助基金：教育部专项研究项目2013116

在线出版日期：2017-12-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：101-105

英文信息展示

期刊专题