单声道语音降噪方法、系统、设备及可读存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

单声道语音降噪方法、系统、设备及可读存储介质

引用
本发明属于语音降噪领域,公开了一种单声道语音降噪方法、系统、设备及可读存储介质,包括获取待降噪的单声道语音;构建基于LSTM神经网络的初始降噪模型;获取预设数量的增强训练样本,采用预设数量的增强训练样本训练初始降噪模型,得到降噪模型;通过降噪模型将待降噪的单声道语音降噪,得到人声音频。降噪过程不受限于双声道的限制,能够实现任何单声道语音的降噪处理,基于同一通语音中整个时间序列的噪音类别大致相同的特性,通过采用LSTM神经网络为基础进行模型的训练,便于学习到整个时间序列的噪音规律,进而达到较好的降噪效果。同时,基于噪声影响因素的复杂性,通过增强训练样本对初始降噪模型再次训练,进一步提升降噪模型的降噪效果。

发明专利

CN202011534575.3

2020-12-22

CN112614504A

2021-04-06

G10L21/0216(2013.01)

平安科技(深圳)有限公司

王健宗;程宁;张之勇

518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼

北京中巡通大知识产权代理有限公司

郭瑶

广东;44

1.一种单声道语音降噪方法,其特征在于,包括以下步骤: 获取待降噪的单声道语音; 构建基于LSTM神经网络的初始降噪模型; 获取预设数量的增强训练样本,采用预设数量的增强训练样本训练初始降噪模型,得到降噪模型; 通过降噪模型将待降噪的单声道语音降噪,得到人声音频。 2.根据权利要求1所述的单声道语音降噪方法,其特征在于,所述构建基于LSTM神经网络的初始降噪模型包括: 获取若干人声音频和若干噪音音频并随机组合,得到若干混合音频,各混合音频中均包括一人声音频及至少一个噪音音频; 将混合音频进行分帧加窗处理及傅里叶变换,得到若干混合音频帧频谱; 将若干混合音频帧频谱分为训练集和测试集,建立用于二分类的LSTM神经网络模型,通过训练集训练LSTM神经网络模型,通过测试集测试训练后的LSTM神经网络模型,当测试结果的合格率符合预设的合格率阈值时测试合格,得到初始降噪模型。 3.根据权利要求2所述的单声道语音降噪方法,其特征在于,所述通过训练集训练LSTM神经网络模型包括: 将训练集内的混合音频帧频谱输入LSTM神经网络模型,得到人声频谱和噪音频谱并进行逆傅里叶变换,得到预测的人声音频及噪音音频; 根据预测的人声音频与实际的人声音频之间的误差,迭代更新LSTM神经网络模型中的各参数,至训练次数达到预设值或预测的人声音频与实际的人声音频之间的误差不再下降。 4.根据权利要求1所述的单声道语音降噪方法,其特征在于,所述获取预设数量的增强训练样本,采用预设数量的增强训练样本训练初始降噪模型包括: 获取若干初始降噪模型降噪不合格的单声道语音,作为预设数量的增强训练样本; 获取若干通过人声音频和若干噪音音频组合形成的测试样本; 采用无监督学习的方式,通过预设数量的增强训练样本训练初始降噪模型,至训练后的初始降噪模型对测试样本的降噪效果与初始降噪模型对测试样本的降噪效果在预设误差内,且训练后的初始降噪模型对增强训练样本的降噪效果大于初始降噪模型对增强训练样本的降噪效果预设阈值。 5.根据权利要求4所述的单声道语音降噪方法,其特征在于,所述通过预设数量的增强训练样本训练初始降噪模型时,将初始降噪模型中若干隐藏层的参数固定。 6.根据权利要求4所述的单声道语音降噪方法,其特征在于,所述通过预设数量的增强训练样本训练初始降噪模型前,在初始降噪模型的隐藏层与分类层之间添加若干随机非线性层。 7.根据权利要求1所述的单声道语音降噪方法,其特征在于,所述通过降噪模型将待降噪的单声道语音降噪,得到人声音频包括: 将待降噪的单声道语音进行傅里叶变换,得到通话语音频谱; 将通话语音频谱输入降噪模型,得到人声频谱和噪音频谱; 将人声频谱进行逆傅里叶变换,得到人声音频。 8.一种单声道语音降噪系统,其特征在于,包括: 获取模块,用于获取待降噪的单声道语音; 模型构建模块,用于构建基于LSTM神经网络的初始降噪模型; 增强训练模块,用于获取预设数量的增强训练样本,采用预设数量的增强训练样本训练初始降噪模型,得到降噪模型;以及 降噪模块,用于通过降噪模型将待降噪的单声道语音降噪,得到人声音频。 9.一种终端设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述单声道语音降噪方法的步骤。 10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述单声道语音降噪方法的步骤。
相关文献
评论
法律状态详情>>
2021-04-06公开
相关作者
相关机构