基于分割的任意形状场景文本检测
随着深度学习技术的发展,自然场景文本检测的性能获得了显著的提升.但目前仍然存在两个主要的挑战:一是速度和准确度之间的权衡,二是对任意形状的文本实例的检测.本文采用基于分割的方法高效准确的检测任意形状场景文本.具体来说,使用具有低计算成本的分割头和简洁高效的后处理,分割头由特征金字塔增强模块和特征融合模块组成,前者可以引入多层次的信息来指导更好的分割,后者可以将前者给出的不同深度的特征集合成最终的特征进行分割.本文采用可微二值化模块,自适应地设置二值化阈值,将分割方法产生的概率图转换为文本区域,从而提高文本检测的性能.在标准数据集ICDAR2015和Total-Text上,本文提出的方法使用轻量级主干网络如ResNet18在速度和准确度方面都达到了可比较的结果.
自然场景文本检测、分割、特征金字塔增强模块、特征融合模块、可微二值化模块
29
2020-12-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
257-262