10.16652/j.issn.1004-373x.2023.16.025
基于深度学习的场景图像自适应文本检测方法
为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM).将不同尺度的文本生成不同数量的角点进行定位,利用自适应阈值的方法生成文本分割图,结合生成的角点候选框进行联合优化.实验结果表明:所提方法在ICDAR2015数据集上综合指标F为86.5%,相较于PSENet网络提升0.8%;在Total-Text和CTW1500数据集上综合指标F分别为85.3%和84.2%,相较于DBNet网络分别提升0.6%和0.8%.该方法能有效提高任意形状文本检测的鲁棒性.
自适应文本检测、自然场景图像、深度学习、自适应角点检测、自适应阈值分割、ResNet-50网络、特征金字塔网络(FPN)
46
TN911.73-34
国家自然科学基金12102306
2023-08-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
143-148