DOI：10.3969/j.issn.1673-629X.2017.06.014

基于i-vector和深度学习的说话人识别

引用

摘要：

为了提高说话人识别系统的性能,在研究基础上提出了一种将深度神经网络(Deep Neural Nerwork,DNN)模型成果与i-vector模型相结合的新方案.该方案通过有效的神经网络构建,准确地提取了说话人语音里的隐藏信息.尽管DNN模型可以帮助挖掘很多信息,但是i-vector特征并没有完全覆盖住声纹特征的所有维度.为此,在i-vector特征的基础上继续提取维数更高的i-supervector特征,有效地避免了信息的不必要损失.为证明提出方案的可行性,采用对TIMIT等语音数据库630个说话人的语音进行了训练、验证和测试.验证实验结果表明,在提取i-vector特征的基础上提取i-supervector特征的说话人识别同等错误率有30%的降低,是一种有效的识别方法.

关键词：说话人识别、深度神经网络、i-vector、声纹特征

所属期刊栏目：27

分类号：TP301(计算技术、计算机技术)

资助基金：国家自然科学青年基金项目61401227;江苏省高校自然科学研究面上项目16KJB520013

在线出版日期：2017-07-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：66-71

英文信息展示

期刊专题