10.19678/j.issn.1000-3428.0059354
一种基于时频域特征融合的语音增强方法
为充分利用含噪语音特征来提升深度神经网络的语音增强性能,提出一种融合时频域特征的语音增强方法.以含噪语音的波形和纯净语音的对数功率谱分别作为训练特征和训练目标,获取含噪语音时域特征到纯净语音频域特征的映射关系.将含噪语音的波形和对数功率谱共同作为训练特征,构建融合含噪语音时域和频域特征的深度神经网络实现语音增强.实验结果表明,与单纯使用频域特征的语音增强方法相比,该方法能够明显提升增强语音的质量和可懂度,具有更好的语音增强性能.
语音增强;深度神经网络;特征融合;时域特征;频域特征
47
TN912.3
国家自然科学基金61701286
2021-10-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
75-81