基于分离结果信噪比估计与自适应调频网络的单通道语音分离技术
在实际应用中,语音分离模型往往受到未知噪声的干扰,从而出现泛化性能严重退化的问题.据此本文提出了基于分离结果信噪比估计与自适应调频网络的单通道语音分离方法.该方法首先通过预测网络对测试信号分离结果的尺度不变信噪比进行估计,以此计算模型的认知不确定性;然后,设计自适应调频网络针对不确定性较高的信号进行自适应频谱调节,以降低模型认知不确定性,从而提升模型在面对未知噪声时的泛化能力.实验结果表明:本文提出的方法相比于单独的时域卷积语音分离网络,将SI-SNR指标从2.72 dB提升至4.57 dB,增幅达到67.94%,在泛化能力上具有较大的改善;相比于增加了软掩膜过滤机制的时域卷积语音分离网络,将SI-SNR指标从3.32 dB提升至4.57 dB,增幅达到37.65%,表明该方法在提高泛化能力方面的能力优于软掩膜过滤机制.
语音分离、不确定性度量、噪声鲁棒、神经网络
40
TP301(计算技术、计算机技术)
国家自然科学基金62073086
2023-04-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
45-54