10.19734/j.issn.1001-3695.2018.03.0230
复杂场景文本段识别
针对背景复杂或者存在字符黏连时文本段图片无法准确切分的情况进行了研究,提出了一种复杂场景文本段识别方法.该方法利用图像和文字序列的相关性设计双向递归神经网络对图像特征序列进行编码,然后设计集成的连接时间分类(CTC)和注意力(attention)模块对编码特征进行解码输出.该算法在多个数据集(公开数据集ICDAR2013和ICDAR2003以及验证码数据集)上进行测试,得到识别准确率分别为90.2%、87.4%和92.5%,从而证明了该算法的有效性.实验结果对文本段识别和应用有重要意义.
文本段识别、连接时间分类、注意力、集成
36
TP391.41(计算技术、计算机技术)
2019-12-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
2818-2820,2844