10.19678/j.issn.1000-3428.0046946
基于改进i-vector的说话人感知训练方法研究
基于辨识向量(i-vector)的说话人感知训练方法使用MFCC作为输入特征对i-vector进行提取,但MFCC较差的特征鲁棒性会影响该训练方法的识别性能.为此,提出一种基于改进i-vector的说话人感知训练方法.设计基于SVD的低维特征提取方法,用其提取的特征替代MFCC对表征能力更优的i-vector进行提取.实验结果表明,在捷克语语料库中,相对于DNN-HMM语音识别系统与原始基于i-vector的说话人感知训练方法,该方法的识别性能分别提升了1.62%与1.52%,在WSJ语料库中,该方法识别性能分别提升了3.9%和1.48%.
说话人感知训练、辨识向量、深度神经网络、奇异值矩阵分解、瓶颈特征
44
TN912
国家自然科学基金61673395,61403415;河南省自然科学基金162300410331
2018-11-23(万方平台首次上网日期,不代表论文的发表时间)
共6页
262-267