10.3969/j.issn.2095-302X.2015.06.015
中英文混排扭曲文本图像快速校正方法
针对OCR在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想的情况,提出一种快速扭曲校正方法.图像经过预处理后,首先利用形态学膨胀定位文本行,得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒;然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构.实验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果,校正后图像OCR识别率有明显提高.
中英文混排、扭曲文档图像、文本行提取、字符切分
36
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61371142
2016-03-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
920-925