10.3979/j.issn.1673-825X.201912060430
基于EAST改进的任意方向场景文本检测
高效和准确的场景文本(efficient and accuracy scene text,EAST)检测算法速度快且结构简单,但是由于文本结构的特殊性,导致在检测中尺寸较小的文本会被遗漏,而较长的文本则完整性较差.针对EAST算法存在的问题提出一种新的自然场景文本检测模型.该方法利用自动架构搜索的特征金字塔网络(neural architecture search feature pyramid network,NAS-FPN)设计搜索空间,覆盖所有可能的跨尺度连接提取自然场景图像特征.针对输出层进行修改,一方面通过广义交并比(generalized intersection over union,GIOU)作为指标提升边界框的回归效果;另一方面通过对损失函数进行修改解决类别失衡问题.输出场景图像中任意方向的文本区域检测框.该方法在ICDAR2013和ICDAR2015数据集上都取得了较好的检测结果,与其他文本检测方法相比,检测效果也得到了明显提升.
文本检测;全卷积网络;搜索空间;广义交并比;类别失衡
33
TP391.4(计算技术、计算机技术)
国家自然科学基金;重庆科委自然科学基金;重庆高校创新团队建设计划智慧医疗系统与核心技术
2021-11-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
868-876