回归-聚类联合框架下的手写文本行提取

引用

摘要：

目的手写文本行提取是文档图像处理中的重要基础步骤,对于无约束手写文本图像,文本行都会有不同程度的倾斜、弯曲、交叉、粘连等问题.利用传统的几何分割或聚类的方法往往无法保证文本行边缘的精确分割.针对这些问题提出一种基于文本行回归-聚类联合框架的手写文本行提取方法.方法首先,采用各向异性高斯滤波器组对图像进行多尺度、多方向分析,利用拖尾效应检测脊形结构提取文本行主体区域,并对其骨架化得到文本行回归模型.然后,以连通域为基本图像单元建立超像素表示,为实现超像素的聚类,建立了像素-超像素-文本行关联层级随机场模型,利用能量函数优化的方法实现超像素的聚类与所属文本行标注.在此基础上,检测出所有的行间粘连字符块,采用基于回归线的k-means聚类算法由回归模型引导粘连字符像素聚类,实现粘连字符分割与所属文本行标注.最后,利用文本行标签开关实现了文本行像素的操控显示与定向提取,而不再需要几何分割.结果在HIT-MW脱机手写中文文档数据集上进行文本行提取测试,检测率DR为99.83％,识别准确率RA为99.92％.结论实验表明,提出的文本行回归-聚类联合分析框架相比于传统的分段投影分析、最小生成树聚类、Seam Carving等方法提高了文本行边缘的可控性与分割精度.在高效手写文本行提取的同时,最大程度地避免了相邻文本行的干扰,具有较高的准确率和鲁棒性.

关键词：手写文本行提取、超像素、图像分割、回归、聚类

所属期刊栏目：23

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金项目61771347,61372193

在线出版日期：2018-09-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：1207-1217

英文信息展示

期刊专题