10.3969/j.issn.1004-9037.2004.04.005
表格文本图像中文字的提取算法
提出了一种从含有表格的文本图像的页面中提取文字的算法.该算法通过模板扫描形成包围图像前景像素的矩形框,从而提取出前景像素,进而组合矩形框形成模式链.利用模式的最大黑游程、长、宽三个统计特征实现对模式的分类.实验结果表明,该算法不仅对普通的表格有效,而且还可以从倾斜的表格及流程图中成功地提取出文字.本算法只适用于二值图像.
文本图像、页面分割、模式、文字提取
19
TP751;O4(遥感技术)
国家自然科学基金30300088;江苏省教育厅自然科学基金L0112419925
2005-01-27(万方平台首次上网日期,不代表论文的发表时间)
共5页
381-385