10.3969/j.issn.1006-8961.2005.06.011
基于模式链分析的文本页面图像的分割与分类
为了能对复杂版式的文本图像(如包含镶嵌在文字中的形状不规则的图片区)的页面进行图文分割与分类,提出了一种新的基于模式链分析的文本页面分割与分类算法.该算法首先使用外接矩形框出图像中的所有黑像素,并且存入矩形框链表中,再组合所有相邻的矩形进而形成模式,最后依据各模式的统计特征分类,输出文字区和图片区两类图像.另外,对大图片模式周围个别不确定的模式,本文采用了上下文分类的算法进行再次分类.实验结果表明,该算法不仅运算速度快,而且能够对复杂版式的页面图像进行正确的图文分割和分类.
矩形框链表、模式链表、模式上下文、页面分割和分类
10
TP391.4;O4(计算技术、计算机技术)
国家自然科学基金30300088
2005-07-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
741-745