10.3969/j.issn.1003-0077.2006.04.009
基于HMM的满文文本识别后处理的研究
将满文单词识别系统的识别信息和满文的词组信息有机的结合起来,建立满文词组和待定词集统计信息库,采用基于统计的隐马尔可夫模型的方法,依据贝叶斯准则,综合满文待定词的后验概率和词组的先验概率信息,建立合理有效便于实现的数据结构,采用动态规划法对满文单词识别系统输出存在的拒识词和错识词进行检测和纠正,从而有效的提高满文文本识别系统的识别率.实验表明:后处理性能除取决于语言模型外,还取决于概率的精确估计.另外,在单词识别系统识别率高的情况下,后处理的纠错能力会增强.
计算机应用、中文信息处理、满文、后处理、模糊矩阵、贝叶斯准则、特征矢量
20
TP301(计算技术、计算机技术)
辽宁省自然科学基金2001113
2006-08-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
63-67