基于改进i-vector的说话人感知训练方法研究

引用

摘要：

基于辨识向量(i-vector)的说话人感知训练方法使用MFCC作为输入特征对i-vector进行提取,但MFCC较差的特征鲁棒性会影响该训练方法的识别性能.为此,提出一种基于改进i-vector的说话人感知训练方法.设计基于SVD的低维特征提取方法,用其提取的特征替代MFCC对表征能力更优的i-vector进行提取.实验结果表明,在捷克语语料库中,相对于DNN-HMM语音识别系统与原始基于i-vector的说话人感知训练方法,该方法的识别性能分别提升了1.62％与1.52％,在WSJ语料库中,该方法识别性能分别提升了3.9％和1.48％.

关键词：说话人感知训练、辨识向量、深度神经网络、奇异值矩阵分解、瓶颈特征

所属期刊栏目：44

分类号：TN912

资助基金：国家自然科学基金61673395,61403415;河南省自然科学基金162300410331

在线出版日期：2018-11-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：262-267

英文信息展示

期刊专题