10.3969/j.issn.1003-6059.2012.02.021
一种基于连通分量的文本区域定位方法
文本区域定位对复杂背景图像中的字符识别和检索具有重要意义.已有方法取得高的定位准确率和召回率,但效率较低,难以应用于实际的系统中.文中提出一种基于连通分量过滤和K-means聚类的文本区域定位方法.该方法首先对图像进行自适应分割,对字符颜色层提取连通分量.然后提取连通分量的特征,并用Adaboost分类器过滤非字符连通分量.最后,对候选的字符连通分量根据其位置和颜色层进行K-means聚类来定位文本区域.实验结果显示该方法具有与当前方法相当的准确率和召回率,同时具有较低的计算复杂度.
文本定位、Adaboost、K-means聚类、文档图像识别
25
TP391(计算技术、计算机技术)
国家自然科学基金项目61005067;浙江省科技厅重大专项项目2010C11049
2012-07-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
325-331