抗倾斜的中文文本图像文件识别技术
针对实际应用场景中如何在大批量图像文件中快速找到中文印刷体文本图像文件进行OCR(Optical Character Recognition)识别的问题,本文在笔画宽度变换算法(SWT)的基础上,设计了针对中文文本固有特点的启发式规则,并将水平投影技术与离散傅里叶变换相结合,提出了一种适合倾斜角度在–90至90°之间的中文印刷体文本图像文件识别技术.实验结果显示,在1606张测试集图像文件的识别中,本文算法针对文本图像文件整体识别F值(F-Measure)为0.95,平均识别耗时为0.65 s.
笔画宽度算法、中文文本图像文件识别、水平投影、离散傅里叶变换
28
浙江省服装个性化定制协同创新中心项目浙教高科[2016]63号
2019-03-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
32-37