DOI：10.3969/j.issn.1673-629X.2021.11.013

基于Tesseract_OCR文字识别的研究

引用

摘要：

光学字符识别(optical character recognition,OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字.该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析.文字信息提取模块包括图像预处理、文字信息区域的截取和修正、字符分割,对输入的图片进行处理,以降低随机噪声,确保文字信息区域包含完整的文字信息,提高识别的准确性.使用Tesseract的OCR引擎对处理后的文字信息区域部分进行识别,提取出图片中的文字信息.微软基础类库(Microsoft foundation classes,MFC),是微软公司实现的一个C++类库,主要封装了一部分的API函数,灵活性大.最后,在VS2015环境下使用微软基础类库实现了一个文字识别系统,并对样本图片库进行系统的测试.测试结果表明,该系统具有更高的识别率.

关键词：光学字符识别;文字识别;Tesseract框架;微软基础类库;C++

所属期刊栏目：31

分类号：TP391(计算技术、计算机技术)

资助基金：江苏省自然科学基金-青年基金项目BK20140868

在线出版日期：2021-11-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：76-80

英文信息展示

期刊专题