10.3969/j.issn.2095-2163.2020.12.008
基于Faster-RCNN网络的表格检测算法研究
为了快速、准确地识别出文档图片中存在的表格,为表格信息提取提供表格图像数据,为表格内容的语义分割打下基础.本文首先使用OpenCV图像处理工具对包含表格的文档图片进行预处理,再采用Labelme标注工具对图片中的表格位置进行标注;其次,把图片数据集按照4:1比例分为表格识别模型训练数据集和模型验证数据集;最后,借助Tensorflow深度学习工具,采用Faster-RCNN目标检测框架对表格识别模型进行训练,并用验证数据集对训练好的模型进行验证实验.实验结果表明,基于Faster-RCNN算法的表格检测模型系统平均每张图片的处理时间为1.31s,识别准确率达到92.4%.说明Faster-RCNN目标检测算法能准确且快速地检测出文档图像中存在的表格.
图像处理、表格检测、深度学习、Faster-RCNN、Tensorflow
10
TP3-05(计算技术、计算机技术)
2021-04-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
24-27,31