一种语音处理方法、装置和电子设备
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种语音处理方法、装置和电子设备

引用
本发明实施例提供了一种语音处理方法、装置和电子设备,其中,所述方法包括:获取待处理语音数据对应的待处理频谱信息;采用语音增强模型确定所述待处理频谱信息对应的目标比率掩模,以及依据所述目标比率掩模和待处理频谱信息确定目标频谱信息并输出;其中,所述语音增强模型依据所述目标频谱信息进行反向训练;相对于现有技术语音保真和语音质量不能两全的情况而言,本发明实施例可以在语音保真的同时又能尽量提高语音质量,从而提高了语音增强效果。

发明专利

CN201910200133.6

2019-03-15

CN111696571A

2020-09-22

G10L21/0232(2013.01)

北京搜狗科技发展有限公司

文仕学;潘逸倩

100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

北京润泽恒知识产权代理有限公司

莎日娜

北京;11

1.一种语音处理方法,其特征在于,包括: 获取待处理语音数据对应的待处理频谱信息; 采用语音增强模型确定所述待处理频谱信息对应的目标比率掩模,以及依据所述目标比率掩模和待处理频谱信息确定目标频谱信息并输出; 其中,所述语音增强模型依据所述目标频谱信息进行反向训练。 2.根据权利要求1所述的方法,其特征在于,所述语音增强模型包括前级网络和后级网络, 所述采用语音增强模型确定所述待处理频谱信息对应的目标比率掩模,包括: 将所述待处理频谱信息输入至所述语音增强模型的前级网络,由所述前级网络对所述待处理频谱信息进行处理并输出目标比率掩模; 所述依据所述目标比率掩模和待处理频谱信息确定目标频谱信息,包括: 将所述待处理频谱信息和目标比率掩模输入至所述语音增强模型的后级网络,由所述后级网络对所述待处理频谱信息和目标比率掩模进行处理并输出目标频谱信息。 3.根据权利要求2所述的方法,其特征在于,所述待处理频谱信息和目标比率掩模均为矩阵, 所述由所述后级网络对所述待处理频谱信息和目标比率掩模进行处理并输出目标频谱信息,包括: 由所述后级网络将所述待处理频谱信息和目标比率掩模进行点乘,输出目标频谱信息。 4.根据权利要求1所述的方法,其特征在于,所述的方法还包括训练所述语音增强模型的步骤: 收集多组训练数据,一组所述训练数据包括带噪声的语音数据对应的频谱信息和所述带噪声的语音数据中语音部分对应的参考频谱信息; 针对一组训练数据,将所述组训练数据中带噪声的语音数据对应的频谱信息输入至所述语音增强模型中,得到目标频谱信息; 将所述组训练数据中的参考频谱信息与所述目标频谱信息进行比对,对所述语音增强模型进行反向训练。 5.根据权利要求4所述的方法,其特征在于,所述将所述组训练数据中的参考频谱信息与所述目标频谱信息进行比对,对所述语音增强模型进行反向训练,包括: 计算所述组训练数据中的参考频谱信息与所述目标频谱信息的均方误差; 通过最小化所述均方误差,调整所述语音增强模型的权值。 6.根据权利要求1所述的方法,其特征在于,所述的方法还包括: 对所述目标频谱信息进行时域变换,得到对应的目标语音数据。 7.一种语音处理装置,其特征在于,包括: 信息获取模块,用于获取待处理语音数据对应的待处理频谱信息; 语音增强模块,用于采用语音增强模型确定所述待处理频谱信息对应的目标比率掩模,以及依据所述目标比率掩模和待处理频谱信息确定目标频谱信息并输出;其中,所述语音增强模型依据所述目标频谱信息进行反向训练。 8.根据权利要求7所述的装置,其特征在于,所述语音增强模型包括前级网络和后级网络,所述语音增强模块包括: 比率掩模确定子模块,用于将所述待处理频谱信息输入至所述语音增强模型的前级网络,由所述前级网络对所述待处理频谱信息进行处理并输出目标比率掩模; 频谱信息确定子模块,用于将所述待处理频谱信息和目标比率掩模输入至所述语音增强模型的后级网络,由所述后级网络对所述待处理频谱信息和目标比率掩模进行处理并输出目标频谱信息。 9.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-6任一所述的语音处理方法。 10.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令: 获取待处理语音数据对应的待处理频谱信息; 采用语音增强模型确定所述待处理频谱信息对应的目标比率掩模,以及依据所述目标比率掩模和待处理频谱信息确定目标频谱信息并输出; 其中,所述语音增强模型依据所述目标频谱信息进行反向训练。
相关文献
评论
法律状态详情>>
2020-09-22公开
2020-09-22公开
相关作者
相关机构