DOI：10.3969/j.issn.1003-3254.2015.04.005

多声源环境下的鲁棒说话人识别

引用

摘要：

针对多声源干扰环境下说话人识别系统性能急剧下降的问题，提出一种提取目标语音的前端处理方法，该方法依据独立语音时频域的近似稀疏性，基于目标语音方位信息采用非线性时频掩蔽方法提取目标语音。建立了基于梅尔倒谱系数(MFCC)的高斯混合模型(GMM)说话人识别系统。仿真实验证明，该方法能有效提取目标语音，提高说话人识别系统的鲁棒性。该文多声源干扰仿真实验条件下，说话人识别系统的识别率平均提高了25%左右。

关键词：说话人识别、语音增强、方位信息、时频掩蔽、MFCC参数

分类号：TN9;TJ4

在线出版日期：2015-05-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：32-37

英文信息展示

期刊专题