DOI：10.3969/j.issn.1006-8961.2007.12.022

一种脱机手写体汉字识别的容错编码方法研究

引用

摘要：

手写体汉字识别是字符识别领域中的难点.为了使机器识别汉字适应于手写体汉字的变形等因素,基于人类认识汉字的容错机理,提出了一种用于机器识字的汉字容错编码方法,以提高手写体汉字识别率.该编码方法首先对横竖撇捺笔划形态给出了模糊化表示;然后定义了仿人拆字的字元集,并给出了易混淆笔划字元的多归类容错编码;接着给出了笔划字元的顺序判断规则和归结了36类简单常用字的部首子结构,并给出冗余的容错编码;进而建立了仿人构字的汉字编码规则和具有容错性的多模板字典,并对<新华字典>中收录的10000余个单字汉字进行了标准编码,重码率为0.48%;最后对HCCORG和NKIM手写体汉字库中的100个手写体汉字进行了仿真识别,识别正确率为96%.试验结果表明,这种编码方法可生成多模板字典,不仅对手写体汉字变形具有较好的容错性,且重码率和误识率较低.

关键词：脱机手写体汉字识别、容错编码、字元集、笔划顺序、子结构

所属期刊栏目：12

分类号：TP391.43(计算技术、计算机技术)

在线出版日期：2008-04-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：2169-2178

英文信息展示

期刊专题