10.3969/j.issn.1003-3254.2015.04.005
多声源环境下的鲁棒说话人识别
针对多声源干扰环境下说话人识别系统性能急剧下降的问题,提出一种提取目标语音的前端处理方法,该方法依据独立语音时频域的近似稀疏性,基于目标语音方位信息采用非线性时频掩蔽方法提取目标语音。建立了基于梅尔倒谱系数(MFCC)的高斯混合模型(GMM)说话人识别系统。仿真实验证明,该方法能有效提取目标语音,提高说话人识别系统的鲁棒性。该文多声源干扰仿真实验条件下,说话人识别系统的识别率平均提高了25%左右。
说话人识别、语音增强、方位信息、时频掩蔽、MFCC参数
TN9;TJ4
2015-05-13(万方平台首次上网日期,不代表论文的发表时间)
共6页
32-37