10.3969/j.issn.1006-9348.2023.02.041
嵌入重评分机制的自然场景文本检测方法
针对自然场景文本检测中存在大量假阳性问题,提出了嵌入重评分机制的自然场景文本检测方法.引入实例分割网络(Mask R-CNN)作为基本框架,实现对自然场景中多方向、不规则文本的检测;设计文本掩膜重评分机制,通过预测文本掩膜的质量,将文本的语义类别信息与其对应的掩膜完整性信息相结合,重新评估文本掩膜的质量,精确了文本的候选区域;重新设计损失函数的作用范围.上述模型基于端到端训练,在ICDAR2013、ICDAR2015和Total-Text等数据集进行性能测试,结果表明,提出的方法有效的提高了字符分割的完整性,较之现有方法明显地提高了文本检测的准确率和召回率,更适合自然场景中的不规则文本的识别.
文本检测、文本识别、自然场景、实例分割
40
TP399(计算技术、计算机技术)
国家自然科学基金;上海市科技计划项目;上海市教育科学研究项目;教育部人文社会科学研究项目
2023-04-10(万方平台首次上网日期,不代表论文的发表时间)
共9页
228-235,302