合成语音数据的方法和装置
本发明公开了合成语音数据的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:解析指示信息,以确定第一用户的声纹;获取语音数据,并根据所述第一用户的声纹从所述语音数据中识别出第一用户的目标语音数据;根据所述第一用户的目标语音数据,更新所述第一用户对应的目标语料库;获取第二用户的语音数据,并基于所述第二用户的语音数据和更新后的所述第一用户对应的目标语料库,合成响应语音数据。该实施方式在任何时候采集第一用户的目标语音数据,不断更新第一用户的目标语料库,降低了语音学习成本,并且通过第一用户的声音响应第二用户的语音数据,达到第二用户与第一用户的声音自由交流的效果,提高用户体验。
发明专利
CN201910616259.1
2019-07-09
CN112289303A
2021-01-29
G10L13/033(2013.01)
北京京东振世信息技术有限公司
王伟楠
100086 北京市海淀区知春路76号6层
中原信达知识产权代理有限责任公司
王安娜%王志远
北京;11
1.一种合成语音数据的方法,其特征在于,包括: 解析指示信息,以确定第一用户的声纹; 获取语音数据,并根据所述第一用户的声纹从所述语音数据中识别出第一用户的目标语音数据; 根据所述第一用户的目标语音数据,更新所述第一用户对应的目标语料库; 获取第二用户的语音数据,并基于所述第二用户的语音数据和更新后的所述第一用户对应的目标语料库,合成响应语音数据。 2.根据权利要求1所述的方法,其特征在于,所述根据所述第一用户的目标语音数据,更新所述第一用户对应的目标语料库,包括: 基于预先构建的基础语料库,对所述第一用户的目标语音数据进行切片处理,获得目标语音切片数据; 利用所述第一用户对应的目标语料库,对所述目标语音切片数据进行波纹对比,并根据对比结果,更新所述第一用户对应的目标语料库。 3.根据权利要求2所述的方法,其特征在于,所述利用所述第一用户对应的目标语料库,对所述目标语音切片数据进行波纹对比,并根据对比结果,更新所述第一用户对应的目标语料库,包括: 确定所述目标语音切片数据的文本信息; 根据所述文本信息,从所述第一用户对应的目标语料库提取出所述目标语音切片数据对应的基准参照数据; 对所述目标语音切片数据和所述基准参照数据进行波纹对比; 若对比结果超过预设差异值,则将所述目标语音切片数据放入所述第一用户对应的目标语料库中,以完成所述第一用户对应的目标语料库的更新。 4.根据权利要求1所述的方法,其特征在于,所述基于所述第二用户的语音数据和更新后的所述第一用户对应的目标语料库,合成响应语音数据,包括: 对所述第二用户的语音数据进行语义理解处理,获得所述第二用户的语音数据对应的响应文本数据; 利用更新后的所述第一用户对应的目标语料库,合成所述响应文本数据对应的响应语音数据。 5.根据权利要求1所述的方法,其特征在于,解析指示信息,以确定第一用户的声纹,包括: 解析所述指示信息,获取第一用户的参照语音数据;对所述第一用户的参照语音数据进行声纹分析,获得所述第一用户的声纹;或者, 从所述指示信息中提取预先配置的所述第一用户的声纹。 6.一种合成语音数据的装置,其特征在于,包括: 确定模块,用于解析指示信息,以确定第一用户的声纹; 识别模块,用于获取语音数据,并根据所述第一用户的声纹从所述语音数据中识别出第一用户的目标语音数据; 更新模块,用于根据所述第一用户的目标语音数据,更新所述第一用户对应的目标语料库; 合成模块,用于获取第二用户的语音数据,并基于所述第二用户的语音数据和更新后的所述第一用户对应的目标语料库,合成响应语音数据。 7.一种电子设备,其特征在于,包括: 一个或多个处理器; 存储装置,用于存储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。 8.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。