10.3969/j.issn.1006-8961.2004.05.008
文本页面图像的图文分割与分类算法
为了能对包含不规则图片区和表格的倾斜文本页面图像进行图文分割与分类,提出了一种新的图文分割和分类算法.该算法先采用数学形态学和分级霍夫变换来进行文本倾斜的检测和校正;然后为了使算法能够对包含不规则图片区的文本页面图像进行处理,提出在传统的投影轮廓切割算法中,引入中点切割的过程,以便利用一系列的矩形来近似地逼近不规则的图片区.对于分割后的图像,则提出利用黑白像素比(Rbw)和近邻像素间的交叉相关性(Rcc)两个特征来作为分类的判据.实验结果证明,算法速度快、可靠性高.该算法只适用于二值图像.
文本图像、形态学、图像分割、霍夫变换
9
TP391.4;O4(计算技术、计算机技术)
江苏省教育厅自然科学基金L0112419925;江苏省自然科学基金BK2001137
2004-06-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
571-577