DOI：10.3979/j.issn.1673-825X.202002160046

结合特征融合和金字塔注意力的场景文本检测

引用

摘要：

基于深度学习的场景文本检测普遍缺少特征级的精细化,导致原本设计良好的模型不能被充分利用,提出将特征融合和特征金字塔注意力模块应用到场景文本检测.将基本特征提取网络(PixelLink算法)得到的4个特征映射层以采样后加权叠加的方式进行特征融合,并将结果送给特征金字塔注意力模块.特征融合使各层级的特征信息相结合,从而增加了特征映射层的信息量.采用注意力网络可以在增大感受野的同时不提高计算力,而空间金字塔结构可利用不同的网格尺度或不同的扩张率融合多尺度的特征信息.特征金字塔注意力模块包含精细化金字塔网络分支、非线性变换分支以及全局平均池化分支.实验结果表明,相较于PixelLink算法,该算法在IC-DAR2015和ICDAR2013数据集上综合指标(F-measure,F)分别提升了2.91％和4.04％.

关键词：特征融合;特征金字塔注意力模块;自然场景文本检测;PixelLink;ICDAR2015;ICDAR2013

所属期刊栏目：34

分类号：TP391(计算技术、计算机技术)

资助基金：辽宁省教育厅科学研究项目JDL2019006

在线出版日期：2022-03-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：110-116

英文信息展示

期刊专题