10.3969/j.issn.1000-7024.2012.12.042
非均匀光照图像中粘连手写体和印刷体的辨别
针对文档图像光照不均匀以及手写字符与印刷字符接近甚至粘连等问题,提出一套提取字符并区分手写体和印刷体的方案.首先提出一种基于开关映射(toggle mapping,TM)的双阈值二值化方法,用来提取非均匀光照文档图像中的字符;然后将整幅图像分割成大小相同的网格,从每个网格的邻域中提取边缘特征矩阵.由于相邻网格特征的相似性,使用了基于判别随机场(Discriminative Random Fields,DRF)的分类框架将网格分成手写体和印刷体两类.利用文本行信息的后处理获得更精细、意义更明确的分类结果.在信封邮编区域图像数据库的实验结果表明,提出的方案能够有效提取和辨别非均匀光照文档图像中粘连在一起的手写体和印刷体.另外,在IMA数据库上的实验表明,文中提出的边缘特征矩阵在辨别手写体和印刷体上的性能达到甚至超过以往文献中提出特征的性能.
手写体印刷体辨别、图像二值化、开关映射、边缘特征矩阵、判别随机场
33
TP391(计算技术、计算机技术)
福建省南平市科技基金项目Z2010Z105;南通大学校级自然科学基金项目11Z070
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
4634-4638