10.3969/j.issn.1673-629X.2017.06.014
基于i-vector和深度学习的说话人识别
为了提高说话人识别系统的性能,在研究基础上提出了一种将深度神经网络(Deep Neural Nerwork,DNN)模型成果与i-vector模型相结合的新方案.该方案通过有效的神经网络构建,准确地提取了说话人语音里的隐藏信息.尽管DNN模型可以帮助挖掘很多信息,但是i-vector特征并没有完全覆盖住声纹特征的所有维度.为此,在i-vector特征的基础上继续提取维数更高的i-supervector特征,有效地避免了信息的不必要损失.为证明提出方案的可行性,采用对TIMIT等语音数据库630个说话人的语音进行了训练、验证和测试.验证实验结果表明,在提取i-vector特征的基础上提取i-supervector特征的说话人识别同等错误率有30%的降低,是一种有效的识别方法.
说话人识别、深度神经网络、i-vector、声纹特征
27
TP301(计算技术、计算机技术)
国家自然科学青年基金项目61401227;江苏省高校自然科学研究面上项目16KJB520013
2017-07-12(万方平台首次上网日期,不代表论文的发表时间)
共6页
66-71