10.19678/j.issn.1000-3428.0059118
基于CNN与有限状态自动机的手写体大写金额识别
手写票据识别是模式识别中的研究难点之一,手写体风格多样、票据背景复杂等原因导致手写票据识别的准确率不高.大写金额作为票据中最重要的部分,对其进行准确识别是手写票据自动识别的关键.对基于分割的手写体大写金额识别及处理问题进行研究,提出一种基于卷积神经网络(CNN)与有限状态自动机的手写体大写金额识别方法.在利用过分割和组合过分割项得到单字符后使用CNN对其进行识别.通过对字符进行分类、定义各类字符之间的逻辑关系构造用于语法检查的有限状态自动机,通过语法自动机在识别结果中选择符合语法规则的字符串,并在路径搜索中利用语法自动机优化搜索性能.在此基础上,运用语法自动机对模糊字符进行预测,以纠正CNN的识别错误.实验结果表明,该方法在对大写金额单字符和文本行进行识别时准确率分别高达98.2%与96.6%.
卷积神经网络;有限状态自动机;手写票据识别;大写金额;光学字符识别;模式识别
47
TP391(计算技术、计算机技术)
国家自然科学基金61572005,61672086,61272004
2021-11-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
304-312