10.3969/j.issn.1003-6059.2006.05.004
基于HMM/SVM两级结构的汉语易混淆语音识别
基于HMM的汉语语音识别中,易混淆语音的识别率仍然不高.在分析HMM固有缺陷的基础上,本文提出一种使用SVM在HMM系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节,提高系统性能和效率.通过充分利用Viterbi解码获得的信息来构造新的分类特征,从而解决标准SVM难以处理可变长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和SVM识别器构造等问题.语音识别实验的结果显示,与采用HMM/SVM混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使识别率有明显提高.这表明所提出的具有置信估计环节的HMM/SVM两级结构用于易混淆语音识别是可行的.
语音识别、易混淆语音、隐马尔可夫模型(HMM)、支持向量机
19
TP391.4;TP181(计算技术、计算机技术)
国家自然科学基金项目60575030;黑龙江省留学归国基金项目LC03C10;教育部跨世纪优秀人才培养计划项目资助
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
578-584