10.16208/j.issn1000-7024.2017.04.042
基于改进PNCC和i-vector的说话人识别鲁棒性
针对传统的梅尔频率倒谱系数(MFCC)在说话人识别系统中鲁棒性不足的问题,提出一种基于改进幂率归一化倒谱系数(PNCC)特征算法和身份向量(i-vector)训练模型的方法.与传统的MFCC不同,PNCC利用长时帧估计背景噪声;在此基础上,通过多窗谱估计、平滑幅度谱包络和均值方差归一化(MVA)等技术进一步提升其鲁棒性.以i-vec-tor为基准模型,在TIMIT语音库上进行说话人识别实验,实验结果表明,在不同噪声、不同信噪比下,所提算法相比其它特征有最低的等错误率,鲁棒性最强,在信噪比低于10 dB的噪声环境中具有更大优势.
幂率归一化倒谱系数、身份向量、均值方差归一化、多窗谱估计、鲁棒性、说话人识别
38
TP391.4(计算技术、计算机技术)
广西区自然科学基金项目2012GXNSFAA053221;广西千亿元产业产学沿用合作基金项目信科院0168
2017-06-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
1071-1075