10.3778/j.issn.1002-8331.2009.32.035
潜在语义分析在连续语音识别中的应用
研究了潜在语义分析(LSA)理论及其在连续语音识别中应用的相关技术.在此基础上利用WSJO文本语料库上构建LSA模型,并将其与3-gram模型进行插值组合,构建了包含语义信息的统计语言模型;同时为了进一步优化混合模型的性能,提出了基于密度函数初始化质心的k-means聚类算法对LSA模型的向量空间进行聚类.WSJO语料库上的连续语音识别实验结果表明:LSA+3-gram混合模型能够使识别的词错误率相比较于标准的3-gram下降13.3%.
潜在语义分析、N元文法、k均值聚类、连续语音识别
45
TP391(计算技术、计算机技术)
2010-01-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
111-113