电话语音识别中基于统计模型的动态通道
与桌面环境相比,电话网络环境下的语音识别率仍然还比较低,为了推动电话语音识别在实际中的应用,提高其识别率成了当务之急.先前的研究表明,电话语音识别率明显下降通常是因为测试和训练环境的电话通道不同引起数据失配造成的,因此该文提出基于统计模型的动态通道补偿算法(SMDC)减少它们之间的差异,采用贝叶斯估计算法动态地跟踪电话通道的时变特性.实验结果表明,大词汇量连续语音识别的字误识率(CER)相对降低约27%,孤立词的词误识率(WER)相对降低约30%.同时,算法的结构时延和计算复杂度也比较小,平均时延约200 ms,可以很好地嵌入到实际电话语音识别应用中.
电话语音识别、动态通道补偿、最大似然估计、最大后验估计
26
TP391.42(计算技术、计算机技术)
国家自然科学基金69835003
2004-12-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
1714-1720