基于DBnet和众筹策略的气象纸质表格快速数字化方法及系统
气象纸质表格历史资料有很高的科学研究价值和很重要的历史保留意义.数字档案通过数字化的方式将纸质原始资料进行收集、保存和提供各类数字信息资源.本文提出了一种"纸质表格扫描成像"+"图像碎片化处理"+"众筹识别"的快速数字化方法及系统,利用气象大数据资源,应用DBnet模型、DSCC算法等技术对纸质气象表格扫描图像进行图像碎片处理;通过用户的登录行为实现"众筹录入",完成气象纸质表格资料的数字化档案工作.经验证,快速数字化系统的一录正确率约为99.7%,高于传统数字化人工键入的一录正确率(95.6%);录入时效比传统数字化提高了 22.2%.该系统保证了数据正确性、提高了工作效率,实现了气象纸质表格资料快速形成数字档案的目标,也为数字档案工作提供了新的思路;在新冠疫情导致传统数字化人工聚集工作模式面临较大风险的背景下,具有一定的现实意义.
气象资料、纸质表格、扫描图像、快速数字化系统、数字档案
50
P409(一般理论与方法)
国家自然科学基金;上海台风研究基金项目
2022-06-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
282-289