DOI：10.3979/j.issn.1673-825X.2012.02.001

基于统计阈值的鲁棒性语音识别

引用

摘要：

近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法能进一步减小训练环境和测试环境的不匹配程度,从而提升了语音识别系统对环境噪声的鲁棒性.首先,对输入的语音提取MFCC声学参数,然后对提取的声学参数作均值方差归一化处理,最后采用统计阈值的方法抑制归一化后存在变异的特征.该算法能增加带噪语音特征和纯净语音特征的相似性；与MFCC为基线的系统相比,在低信噪比情况下,该算法的错误率最高下降约40％,同时该方法也优于其他的鲁棒性特征倒谱均值减和倒谱均值归一.

关键词：鲁棒性、特征提取、均值减、均值方差归一(MVN)、梅尔频率倒谱系数(MFCC)、统计阈值、语音识别

所属期刊栏目：24

分类号：TN912.3

资助基金：The National High Technology Research and Development Program of China Project 2009ZX01038-002-002-2

在线出版日期：2012-07-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：127-132

英文信息展示

期刊专题