DOI：10.16652/j.issn.1004-373x.2023.16.025

基于深度学习的场景图像自适应文本检测方法

引用

摘要：

为了解决自然场景图像中任意形状文本检测的难题,文中提出一种具有自适应文本区域表示的鲁棒场景文本检测方法;同时基于回归和分割方法的两种思想,设计自适应角点检测模块(ACDM)和自适应阈值分割模块(ATSM).将不同尺度的文本生成不同数量的角点进行定位,利用自适应阈值的方法生成文本分割图,结合生成的角点候选框进行联合优化.实验结果表明:所提方法在ICDAR2015数据集上综合指标F为86.5%,相较于PSENet网络提升0.8%;在Total-Text和CTW1500数据集上综合指标F分别为85.3%和84.2%,相较于DBNet网络分别提升0.6%和0.8%.该方法能有效提高任意形状文本检测的鲁棒性.

关键词：自适应文本检测、自然场景图像、深度学习、自适应角点检测、自适应阈值分割、ResNet-50网络、特征金字塔网络(FPN)

所属期刊栏目：46

分类号：TN911.73-34

资助基金：国家自然科学基金12102306

在线出版日期：2023-08-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：143-148

英文信息展示

期刊专题