10.3969/j.issn.1006-8961.2007.12.022
一种脱机手写体汉字识别的容错编码方法研究
手写体汉字识别是字符识别领域中的难点.为了使机器识别汉字适应于手写体汉字的变形等因素,基于人类认识汉字的容错机理,提出了一种用于机器识字的汉字容错编码方法,以提高手写体汉字识别率.该编码方法首先对横竖撇捺笔划形态给出了模糊化表示;然后定义了仿人拆字的字元集,并给出了易混淆笔划字元的多归类容错编码;接着给出了笔划字元的顺序判断规则和归结了36类简单常用字的部首子结构,并给出冗余的容错编码;进而建立了仿人构字的汉字编码规则和具有容错性的多模板字典,并对<新华字典>中收录的10000余个单字汉字进行了标准编码,重码率为0.48%;最后对HCCORG和NKIM手写体汉字库中的100个手写体汉字进行了仿真识别,识别正确率为96%.试验结果表明,这种编码方法可生成多模板字典,不仅对手写体汉字变形具有较好的容错性,且重码率和误识率较低.
脱机手写体汉字识别、容错编码、字元集、笔划顺序、子结构
12
TP391.43(计算技术、计算机技术)
2008-04-21(万方平台首次上网日期,不代表论文的发表时间)
共10页
2169-2178