基于结构属性的乌金体藏文古籍字符切分

引用

摘要：

字符切分是藏文古籍文档图像分析与识别中重要的一环,针对乌金体藏文古籍文本行倾斜,字符之间笔画交叠、交叉、粘连以及不同程度的笔画断裂、噪声干扰等问题,提出了一种基于结构属性的乌金体藏文字符切分方法.首先,建立了乌金体藏文古籍字符区块库.然后,利用音节点位置信息或结合水平投影与直线检测的方法检测出字符区块的局部基线,并根据基线将字符区块切分为上下两部分;利用改进的模板匹配算法检测基线上方笔画的粘连及其类型,利用多方向、多路径粘连切分算法切分交叉、粘连笔画.最后,根据藏文结构属性对各笔画进行归属,完成字符切分.实验结果表明,本方法能有效解决字符切分中遇到的问题,字符切分的召回率、精确率以及F-Measure可分别达到96.52％、98.24％、97.37％.

关键词：图像处理、藏文古籍文档、字符区块、局部基线、粘连检测与切分、笔画归属

所属期刊栏目：58

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金;国家民委创新团队计划;优秀研究生创新之星项目;重庆市教委科学技术研究项目;重庆第二师范学院校级科研项目

在线出版日期：2021-12-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共16页

页码：252-267

英文信息展示

期刊专题