10.16208/j.issn1000-7024.2023.04.014
乌金印刷多字体藏文的文本检测与识别
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标.实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳.
藏文、乌金字体、多种字体、深度学习、文本检测、文本识别、端到端
44
TP183(自动化基础理论)
国家自然科学基金;西藏大学研究生"高水平人才培养计划"项目
2023-05-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
1058-1065