10.3969/j.issn.0372-2112.2018.10.008
一种融合相位估计的深度卷积神经网络语音增强方法
在时频域的语音增强中,幅度估计和相位估计都是影响语音增强性能的重要因素.为了在基于深度学习的语音增强方法中融合对相位的估计,本文将含噪语音短时傅里叶变换(STFT)的实部和虚部特征作为两个通道输入深度卷积神经网络,通过建立一个同步估计纯净语音STFT的实部和虚部特征的多任务学习模型,实现了对幅度和相位的同步估计.实验结果表明,相比仅考虑幅度估计的方法,本文方法具有更好的噪声抑制能力,在低信噪比条件下,显著提高了语音增强性能.
语音增强、相位估计、幅度估计、深度卷积神经网络
46
TN912.3
国家自然科学基金61701286,11704229;山东省自然科学基金ZR2015FL003,ZR2017MF047,ZR2017LA011
2019-01-04(万方平台首次上网日期,不代表论文的发表时间)
共8页
2359-2366