10.13733/j.jcam.issn.2095-5553.2022.10.020
基于注意力机制的农资标签文本检测
农资包装上的文本含有登记证号、有效成分含量、生产许可证号、产品标准号等产品相关信息,这些不仅为农民购买农资提供重要的依据,还有助于农资监督机构发现影响农资安全的问题,同时也对出口农资的识别有极大的帮助.基于农资包装图像构建数据集,提出一种基于注意力机制的农资标签文本检测模型,该模型使用Swin-Transformer作为骨干网络,采用FPN提取文本特征,设计双特征融合模块(Twin Feature Fusion Module,TFFM)来统合局部特征和全局特征,预测阶段采用缩放式扩展算法来生成文本边框.该模型在自建农资包装图像数据集上的试验结果表明:其准确率、召回率和F值分别为91.4%、87.3%和89.3%,均优于主流方法,对农资包装图像文本检测任务具有一定的优越性.
计算机视觉、农资标签、语义分割、文本检测、文本识别
43
TP391.4(计算技术、计算机技术)
云南省重大科技专项计划项目202002AD080002
2022-10-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
135-140,166