10.3969/j.issn.1003-0077.2005.05.011
印刷维吾尔文本切割
我国新疆地区使用的维吾尔文借用阿拉伯文字母书写.因为阿拉伯文字母自身书写的特点,造成维文文本的切割和识别极其困难.本文在连通体分类的基础上,结合水平投影和连通体分析的方法实现维文文本的文字行切分和单词切分.然后定位单词基线位置,计算单词轮廓和基线的距离,寻找所有可能的切点实现维文单词过切割,最后利用规则合并过切分字符.实验结果表明,字符切割准确率达到99%以上.
计算机应用、中文信息处理、文本切割、字符切割、字符识别、维吾尔文
19
TP391(计算技术、计算机技术)
国家自然科学基金60241005
2005-10-13(万方平台首次上网日期,不代表论文的发表时间)
共8页
76-83