10.3969/j.issn.1006-4222.2022.03.022
基于聚类算法的离散文本同行合并方法研究
印刷品资料等文本图像中存在的局部并列换行现象会导致文本排版识别错误,本文提出的基于聚类算法的离散文本同行合并方法,能够自动将局部并列换行的文本正确归并到同行,得到正确的文本排版结果,有利于图像文本信息结构化数据的提取和处理.
OCR、局部并列换行、文本检测、聚类
29
TP311.13(计算技术、计算机技术)
2022-08-11(万方平台首次上网日期,不代表论文的发表时间)
共3页
64-66