10.3969/j.issn.1003-0077.2006.04.012
一种新的基于主题的语言模型自适应方法
基于主题的语言模型自适应方法应尽可能提高语言模型权重系数的更新速度并降低语言模型的调用量以满足语音识别实时性要求.本文采用基于聚类的方法实现连续相邻二元词对的量化表示并以此刻画语音识别预测历史和各个文本主题中心,依据语音识别历史矢量和各个文本主题中心矢量的相似度更新语言模型权重系数并摒弃全局语言模型.同传统的基于EM算法的自适应方法相比,实验表明该方法明显提高了语音识别性能和实时性,识别错误率相对下降5.1%,说明该方法可比较准确地判断测试内容所属文本主题.
计算机应用、中文信息处理、语言模型、主题自适应、语音识别、文本分类
20
TP391(计算技术、计算机技术)
国家科技攻关项目2001AA114071
2006-08-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
82-87