10.16652/j.issn.1004-373x.2021.10.027
基于深度神经网络的说话人年龄分类研究
说话人年龄分类是通过说话人的语音来估测说话人的年龄范围,属于说话人属性分析的重要内容.传统说话人年龄分类是利用人工提取特征加后端分类器的方法,这种方法不一定能够得到最优的分类效果.针对该问题,利用深度神经网络自动获取特征表示的能力,提出一种基于深度神经网络的年龄分类方法,采用提取文本无关的说话人语音特征来通过深度神经网络对说话人年龄进行分类.在1000 h的AISHELL-2中文开源语音数据库上验证了所提出方法的有效性.与基于i-vector结合后端分类器的两阶段说话人年龄分类方法做了比较,实验结果证明,与i-vector方法相比,识别正确率获得了3.08%的性能提升.
说话人年龄分类、深度神经网络、语音特征提取、说话人识别、数据分析、比较实验
44
TN911.23-34;TP311
国家重点研发计划;国家自然科学基金资助项目;国家自然科学基金资助项目
2021-05-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
120-124