10.3969/j.issn.1003-6059.2006.06.020
脱机手写体满文文本识别系统的设计与实现
通过研究手写体圈点满文文字特征,提出采用基于笔画序列的脱机手写满文识别方法.首先使用数字图像处理方法对识别目标实现单词提取和预处理操作.然后将处理后的单词分解为笔画基元,采用统计模式识别方法进行识别,得到笔画序列.再把笔画序列转换为字根序列,使用模糊串匹配算法实现满文罗马转写的输出.最后再采用基于隐马尔可夫模型方法对单词识别结果进行后处理,进一步提高系统识别率.实验表明,在单一字体笔画学习和大语料双词同现概率统计的基础上,系统的识别率和自适应能力都较好.
满文、文字识别、后处理、串匹配、罗马转写体、隐马尔可夫模型(HMM)
19
TP391(计算技术、计算机技术)
辽宁省自然科学基金资助项目2001113
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
801-805