10.16526/j.cnki.11-4762/tp.2023.01.042
基于OCR技术的航天器材料及器件试验数据识别系统
航天器材料及器件数据库需要海量国内外试验报告数据的支撑,其中表格作为最普遍的数据存储形式含有的数据量最为庞大,然而面对人工识别提取表格数据工作繁琐且易出错的难点,以PDF文档的表格为研究对象,提出基于OCR技术的航天器材料及器件试验数据识别系统;采用了 B/S架构,基于EXT、JAVA、Python等技术语言进行开发,系统具备PDF文档转换、表格识别、数据提取、数据编辑等功能;依据系统设计采用版面分析和PDFPlumber表格检测的关键技术和方法以达导准确有效识别PDF文档表格的目的,采用EXT表格控件形式展现提取的数据经试验测试实现了对PDF文档内规整表格的批量识别和数据提取;验证了设计方案的可行性,满足了试验数据试别系统的高识别准确率、快速识别等特点.
航天器材料与器件、数据识别系统、OCR、PDF文档、表格识别
31
TP391.41(计算技术、计算机技术)
2023-02-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
282-288,293