10.3969/j.issn.1000-1220.2021.11.006
一种基于核典型关联分析的短语音说话人嵌入向量算法
针对短语音条件下,基于全局变异空间提取的身份向量存在估计不足导致性能下说话人识别降的问题,提出了一种基于核典型关联分析的方法融合全局变异空间和时滞神经网络的说话人嵌入向量.首先,分别训练全局变异空间和时滞神经网络模型.然后在注册和测试阶段,同时提取说话人在两者模型中嵌入向量.通过高斯核函数将其映射至高维空间分析其非线性关联关系,从中获得仿射向量,最后将其组合得到最终说话人嵌入向量.实验表明,10秒以下的短语音环境,该方法所提取出的说话人向量相比其余几种说话人嵌入向量在等误差率和最小检测代价上平均下降了16.29%,20.38%,2.78%以及8.03%,7.17%,0.26%.最后,与其他算法进行对比,在等误差率上均有提升.以上实验表明,该文所提出的方法有效提高短语音环境下的说话人识别性能.
全局变异空间;时滞神经网络;核典型相关分析;嵌入向量;短语音
42
TP391(计算技术、计算机技术)
国家自然科学基金项目61761025
2021-11-29(万方平台首次上网日期,不代表论文的发表时间)
共7页
2269-2275