基于扩展N元文法模型的快速语言模型预测算法
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现,极大地提升了语言模型预测的速度,使得高阶语言模型预测成为可能.扩展N元文法模型在解码之前离线生成,生成过程利用了N元文法的稀疏性加速计算过程,并采用了词尾节点前推和分数量化的方法压缩模型存储空间大小.实验表明,相比于采用动态规划在解码过程中实时计算语言模型预测分数的传统方法、本文提出的方法在相同的字错误率下使得整个识别系统识别速率提升了5~9倍,并且采用高阶语言模型预测可获得比低阶预测更优的解码速度与精度.
语音识别、语言模型预测、N元文法模型、解码
38
国家高技术研究发展计划863计划2008AA040201 国家自然科学基金90920302;国家科技支撑计划2009BAH41B01;国家自然科学基金委员会与香港研究资助局联合科研基金60931160443
2013-01-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
1618-1626