一种用于语音识别系统的多环境特征补偿方法

引用

摘要：

本发明公开一种用于语音识别系统的多环境特征补偿方法，在训练阶段，首先进行多环境语音采集，得到多个基本训练环境的训练语音；然后用每个基本训练环境的训练语音，训练生成该基本训练环境的语音模型；在识别阶段，首先为当前测试语音选择与测试环境最接近的基本训练环境的语音模型，然后对选取的语音模型进行参数变换，使之与当前测试环境匹配，最后用变换后的语音模型从含噪测试语音中估计纯净语音特征向量。本发明可以显著提高低信噪比等恶劣应用环境中语音识别系统的性能，提高系统的鲁棒性。

专利类型：发明专利

申请/专利号：CN201210488431.8

申请日期：2012-11-26

公开/公告号：CN102945670A

公开/公告日：2013-02-27

主分类号：G10L15/06(2013.01)I

申请/专利权人:河海大学

发明/设计人:吕勇

主申请人地址:210098 江苏省南京市鼓楼区西康路1号

专利代理机构:南京苏高专利商标事务所(普通合伙) 32204

代理人:柏尚春

国别省市代码:江苏;32

权利要求：

一种用于语音识别系统的多环境特征补偿方法，其特征在于：包括训练阶段步骤和测试阶段步骤；训练阶段的具体步骤包括：(1)在实际应用环境中采集各种噪声；在训练阶段用多个基本训练环境预测实际测试环境，用多个基本训练环境语音模型取代单一纯净训练语音模型；(2)根据噪声类型和强度对采集的噪声进行聚类，将噪声归类到若干个基本训练环境中；(3)用每个基本训练环境的噪声与训练语音混合，得到该基本训练环境的含噪训练语音；(4)对每个基本训练环境的训练语音进行模型训练，得到该基本训练环境的语音模型，用高斯混合模型对每个基本训练环境进行建语音模型，得到该基本训练环境GMM每个高斯单元的混合系数cm、含噪均值向量μy，m和含噪协方差矩阵Σy，m，全部基本训练环境的GMM组成多环境语音模型；测试阶段的具体步骤包括：(5)从多环境模型中选择与当前测试环境最接近的基本训练环境，该基本训练环境的GMM即为最优GMM；(6)用最大似然线性回归对选取的最优GMM进行模型参数变换；最优GMM的均值变换和方差变换用最大似然线性回归实现，均值和方差变换参数直接从含噪测试语音中估计；(7)用参数变换后的最优GMM计算含噪测试语音的后验概率，根据GMM每个高斯单元对应的纯净语音均值向量和含噪测试语音属于GMM各个高斯单元的后验概率估计纯净语音特征向量。

专利专题