10.3969/j.issn.1672-9722.2022.04.029
基于对抗不变性解散的说话人识别
为提高说话人识别模型的性能,论文提出一种新颖的方法来提取具有鲁棒性的说话人可区分性特征.该方法将说话人映射到两个较低维度的嵌入空间,通过解散对抗和注意力机制,其中一个嵌入空间完成从语音信号的所有其他信息中解散出说话人相关信息,而另一个嵌入空间捕获所有其他无关的干扰因素.实验结果表明,在TIMIT数据集的两类实验设置中,论文方法分别比两个最先进方法提高2.74%和2.86%的识别准确率.并且通过实验分析测试集的损失和识别准确率,得出注意力机制和解散模块对本文方法的说话人识别性能确实有提升.
说话人识别、深度学习、注意力机制、对抗不变性解散
50
TN912.3
江苏省大学生创新创业项目201810299045Z
2022-05-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
833-838