针对文档图像的非对称式几何校正网络
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11834/jig.220426

针对文档图像的非对称式几何校正网络

引用
目的 文档图形的几何校正是指通过图像处理的方法对图像采集过程中存在的扭曲、畸变和歪斜等几何干扰进行处理,以提升原始图像的视觉效果与光学字符识别(optical character recognition,OCR)精度.在深度学习普及以前,传统的图像处理方法需要使用激光扫描仪等辅助硬件或在多视角下对文档进行拍摄,且算法的鲁棒性欠佳.深度学习方法构建模型能规避传统算法的不足,但在现阶段这些模型还存在一定的局限性.针对现有算法的缺陷,提出了一种集成文档区域定位与校正的轻量化几何校正网络(asymmetric geometry correction network,Asymc-Net),端到端地实现文档图像的几何校正.方法 AsymcNet由用于文档区域定位的分割网络和用于校正网格回归的回归网络构成,两个子网络以级联的形式搭设.由于分割网络的存在,AsymcNet对于各种视野下的文档图像均能取得良好的校正效果.在回归网络部分,通过减小输出回归网格的分辨率来降低AsymcNet在训练及推理时的显存耗用和时长.结果 在自制的测试数据集中与业内最新的4种方法进行了比较,使用AsymcNet可以将原始图像的多尺度结构相似度(multi-scale structural similarity,MS-SSIM)从0.318提升至0.467,局部畸变(local distortion,LD)从33.608降低至11.615,字符错误率(character error rate,CER)从0.570降低至0.273.相比于业内效果较好的DFE-FC(displacement flow estimation with fully convolutional network),AsymcNet 的 MS-SSIM 提升了 0.036,LD 降低 了2.193,CER降低了 0.033,且AsymcNet处理单幅图像的平均耗时仅为DFE-FC的8.85%.结论 实验验证了本文所提出AsymcNet的有效性与先进性.

图像预处理、几何校正、全卷积网络(FCN)、网格采样、端到端

28

TP391.4(计算技术、计算机技术)

2023-09-08(万方平台首次上网日期,不代表论文的发表时间)

共16页

2314-2329

相关文献
评论
暂无封面信息
查看本期封面目录

中国图象图形学报

1006-8961

11-3758/TB

28

2023,28(8)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn