10.16208/j.issn1000-7024.2022.09.025
基于音节切分的藏文印刷体识别
为解决藏文印刷体标注数据库资源稀少和藏文图像文本分割难度大等问题,提出一种基于音节切分的藏文体印刷体识别方法.以字符面积最小为依据,找到音节分隔符;合并音节分隔符之间的字丁,构成音节;按音节位置进行分割,经实验分割准确率提升3.92个百分点.为验证选择音节的有效性,在同一结构的LetNet-5网络模型上进行测试,实验结果表明,以音节为单元时识别性能更优,其平均识别正确率达96.11%.
藏文印刷体识别、音节切分、字丁切分、文本分割、卷积神经网络
43
TP391.43(计算技术、计算机技术)
青海省科技计划基金项目;国家自然科学基金
2022-10-09(万方平台首次上网日期,不代表论文的发表时间)
共7页
2594-2600