语音合成方法、装置、计算机设备和存储介质
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

语音合成方法、装置、计算机设备和存储介质

引用
本申请涉及一种语音合成方法、装置、计算机设备和存储介质。所述方法包括:对待合成语音文本进行拆分,得到多个拆分后语音文本;对拆分后语音文本进行分类,得到第一语音文本和第二语音文本;第一语音文本为包括有用户信息的语音文本;第二语音文本表示为未包括用户信息的语音文本;获取第一语音文本对应的第一语音,以及,获取第二语音文本对应的第二语音;第一语音与第二语音的语音参数相对应;将第一语音与第二语音进行拼接处理,得到待合成语音文本的合成语音。本方法通过第一语音与第二语音的语音参数相对应,使得拼接后得到的合成语音在语调、音量和音色上保持统一,实现了平滑拼接,极大地降低了拼接点处语音的突兀感。

发明专利

CN202010824547.9

2020-08-17

CN112102807A

2020-12-18

G10L13/02(2013.01)

招联消费金融有限公司

沈传科;赵凯;王福海;张文锋

518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)

广州华进联合专利商标代理有限公司

李文渊

广东;44

1.一种语音合成方法,其特征在于,所述方法包括: 对待合成语音文本进行拆分,得到多个拆分后语音文本; 对所述拆分后语音文本进行分类,得到第一语音文本和第二语音文本;所述第一语音文本为包括有用户信息的语音文本;所述第二语音文本表示为未包括用户信息的语音文本; 获取所述第一语音文本对应的第一语音,以及,获取所述第二语音文本对应的第二语音;所述第一语音与所述第二语音的语音参数相对应; 将所述第一语音与所述第二语音进行拼接处理,得到所述待合成语音文本的合成语音。 2.根据权利要求1所述的方法,其特征在于,在对待合成语音文本进行拆分之前,还包括: 获取语音通话对象的第一应答语音; 通过预先训练的语音识别模型对所述第一应答语音进行识别,得到所述第一应答语音的语音文本信息; 根据所述语音文本信息,确定针对所述第一应答语音的第二应答语音文本; 将所述第二应答语音文本中包括的目标信息替换为所述用户信息,得到所述待合成语音文本。 3.根据权利要求1所述的方法,其特征在于,所述对待合成语音文本进行拆分,得到多个拆分后语音文本,包括: 获取所述待合成语音文本中的语音文本拆分位置;所述语音文本拆分位置根据所述待合成语音文本中的标点位置信息确定; 按照所述语音文本拆分位置,对所述待合成语音文本进行拆分,得到所述待合成语音文本的多个拆分后语音文本。 4.根据权利要求1所述的方法,其特征在于,所述获取所述第一语音文本对应的第一语音,包括: 将所述第一语音文本与预设语音缓存中的预设语音的语音文本进行匹配; 若所述第一语音文本与预设语音缓存中的预设语音的语音文本匹配,则将与所述第一语音文本匹配的语音文本的语音,作为所述第一语音; 若所述第一语音文本与预设语音缓存中的预设语音的语音文本不匹配,则通过预先训练的语音合成模型对所述第一语音文本进行语音合成处理,得到所述第一语音;所述语音合成模型根据与所述第二语音的语音参数对应的语音样本训练得到。 5.根据权利要求1所述的方法,其特征在于,所述获取所述第二语音文本对应的第二语音,包括: 将所述第二语音文本与预设语音缓存中的预设语音的语音文本进行匹配; 若所述第二语音文本与预设语音缓存中的预设语音的语音文本匹配,则将与所述第二语音文本匹配的语音文本的语音,作为所述第二语音。 6.根据权利要求4所述的方法,其特征在于,在通过预先训练的语音合成模型对所述第一语音文本进行语音合成处理,得到所述第一语音之后,还包括: 将所述第一语音存储至所述语音缓存中; 当获取的下一个语音文本与所述第一语音的语音文本相同时,从所述语音缓存中获取所述第一语音,作为所述下一个语音文本对应的语音。 7.根据权利要求2所述的方法,其特征在于,所述根据所述语音文本信息,确定针对所述第一应答语音的第二应答语音文本,包括: 根据所述语音文本信息,确定所述语音通话对象的意向信息; 根据所述意向信息,从预先构建的语音流程树对应的语音文本数据库中获取对应的应答语音文本,作为所述第二应答语音文本。 8.一种语音合成装置,其特征在于,所述装置包括: 语音文本拆分模块,用于对待合成语音文本进行拆分,得到多个拆分后语音文本; 语音文本分类模块,用于对所述拆分后语音文本进行分类,得到第一语音文本和第二语音文本;所述第一语音文本为包括有用户信息的语音文本;所述第二语音文本表示为未包括用户信息的语音文本; 语音获取模块,用于获取所述第一语音文本对应的第一语音,以及,获取所述第二语音文本对应的第二语音;所述第一语音与所述第二语音的语音参数相对应; 语音拼接模块,用于将所述第一语音与所述第二语音进行拼接处理,得到所述待合成语音文本的合成语音。 9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。 10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
相关文献
评论
法律状态详情>>
2020-12-18公开
2020-12-18公开
相关作者
相关机构