基于加权有限状态机的动态匹配词图生成算法

引用

摘要：

由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记，导致当前已有的词图生成算法不含精确的词尾时间点，或者仅是状态、音素级别的词图，无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系，然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题，最后通过令牌传递的遍历方法生成了词图。同时，考虑到计算量优化，在令牌传递过程中引入了剪枝算法，使音素图转词图的耗时不到解码耗时的3%。得到的词图，不仅可以用于语言模型重打分，由于含有精确的词尾时间点，还可以直接应用到关键词检索系统中。实验结果表明，该文的词图生成算法具有较高的计算效率；和已有动态解码器的词图相比，词图中包含更多解码信息，在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。

关键词：自动语音识别、加权有限状态机、词图生成、检索

分类号：TP391.42(计算技术、计算机技术)

资助基金：国家自然科学基金10925419,90920302,61072124,11074275,11161140319,91120001,61271426;中国科学院战略性先导科技专项XDA06030100, XDA06030500;国家863计划项目2012AA012503;中科院重点部署项目KGZD-EW-103-2资助课题

在线出版日期：2014-01-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：140-146

英文信息展示

期刊专题