DOI：10.3969/j.issn.1001-3695.2014.11.038

汉语语音识别中融合发音信息的随机段模型研究

引用

摘要：

提出了一种基于随机段模型的发音信息集成方法。根据随机段模型的模型特性，建立了阶层式人工神经网络来获取语音段信号属于各类音素的后验概率，并通过一遍解码的方式集成到随机段模型系统中。在“863-test”测试集上进行的汉语连续语音识别实验显示汉语字的相对错误率下降了5．93％。实验结果表明了将发音信息应用到随机段模型的可行性。

关键词：语音识别、随机段模型、发音信息、阶层式人工神经网路、发音特征

分类号：TP391.42(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目91120303，90820303，90820011;河南省基础与前沿技术研究计划资助项目132300410332

在线出版日期：2014-11-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：3365-3368

英文信息展示

期刊专题