10.16208/j.issn1000-7024.2021.06.023
基于时域波形映射-频域谐波损失的语音增强
当前大多数基于时域波形映射的语音增强算法,其损失函数的设计没有考虑到语音频谱谐波结构,为此提出一种基于时域波形映射-频域谐波损失的语音增强算法.使用谐波噪声模型(HNM)对纯净语音进行建模,将建模后得到的频域中的HNM分量作为损失函数中的训练目标;通过最小化频域谐波损失函数,训练全卷积神经网络(FCN),使之产生时域增强语音.实验结果表明,使用频域谐波损失函数训练的时域波形映射语音增强模型具有更好的去噪能力,语音质量和语音可懂度显著提高.
语音增强、谐波噪声模型、全卷积神经网络、时域波形映射、频域谐波损失
42
TP391(计算技术、计算机技术)
山西省自然科学基金;山西省重点研发计划高新技术领域基金项目;山西省回国留学人员科研基金项目
2021-07-07(万方平台首次上网日期,不代表论文的发表时间)
共7页
1677-1683