一种语音播报方法、装置、设备及介质
本发明公开了一种语音播报方法、装置、设备及介质,由于本发明实施例中,在网络连通时,将所配置的第一文本信息及表征智能设备语音播报的属性信息的至少一个属性值组发送给TTS服务器,并接收并保存该TTS服务器根据第一文本信息和属性值组合成的音频文件,因此在确定存在语音播报需求时,即使出现网络中断的情况,也可以在本地保存的音频文件中查找所需要的音频文件进行播放,从而提高用户体验。
发明专利
CN202110352361.2
2021-03-31
CN113066474A
2021-07-02
G10L13/02(2013.01)
北京猎户星空科技有限公司
刘浩
100025 北京市朝阳区姚家园南路一号惠通时代广场8号
北京同达信恒知识产权代理有限公司
杜晶
北京;11
1.一种语音播报方法,其特征在于,应用于智能设备,所述方法包括: 若所述智能设备与从文本到语音TTS服务器的网络连通,将已配置的第一文本信息及表征所述智能设备语音播报的属性信息的至少一个属性值组发送给所述TTS服务器; 接收并保存所述TTS服务器返回的音频文件,其中,所述音频文件是所述TTS服务器根据所述第一文本信息和所述属性值组进行语音合成得到的; 若确定需要进行语音播报,则在已保存的音频文件中查找对应的目标音频文件,并控制所述智能设备播放所述目标音频文件。 2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 若在将所述第一文本信息及所述至少一个属性值组发送给所述TTS服务器之后,网络中断,则监测网络状态; 若监测到网络连通,根据已保存的音频文件,确定未合成的数据信息,所述数据信息包括第一文本信息中未合成音频文件的第二文本信息、和/或第一文本信息中未合成音频文件的第一目标属性值组; 将所述数据信息的相关信息发送给所述TTS服务器,以使所述TTS服务器根据所述数据信息合成音频文件。 3.根据权利要求1所述的方法,其特征在于,所述方法还包括: 接收到针对所述第一文本信息的更新请求,确定更新后的第一文本信息; 若已保存的音频文件中未包含更新后的第一文本信息对应的音频文件,则将所述更新后的第一文本信息以及所述更新后的第一文本信息的属性值组发送给所述TTS服务器; 接收所述TTS服务器根据所述更新后的第一文本信息以及所述更新后的第一文本信息的属性值组合成的音频文件并保存。 4.根据权利要求1所述的方法,其特征在于,所述方法还包括: 接收到针对属性信息的属性值的切换请求,确定切换后的第二目标属性值组; 若已保存的音频文件未包含所述第二目标属性值组对应的音频文件,则将所述第一文本信息以及所述第二目标属性值组发送给所述TTS服务器; 接收所述TTS服务器根据所述第二目标属性值组以及所述第一文本信息合成的音频文件并保存。 5.根据权利要求1所述的方法,其特征在于,所述方法还包括: 若满足第一更新条件,获取已保存的各音频文件被使用的频次,将被使用频次低于设定阈值的音频文件删除;和/或, 若满足第二更新条件,确定所述智能设备当前使用的第三目标属性值组,将除所述第三目标属性值组之外的属性值组对应的音频文件删除。 6.根据权利要求1-5任一项所述的方法,其特征在于,所述属性信息包括以下至少一种: 发音人角色、语言、TTS合成音量、语速以及音频采样率。 7.根据权利要求1所述的方法,其特征在于,所述将已配置的第一文本信息及表征所述智能设备语音播报的属性信息的至少一个属性值组发送给所述TTS服务器,包括: 确定所述智能设备当前使用的第三目标属性值组,将已配置的第一文本信息及所述第三目标属性值组发送给所述TTS服务器;或者 根据每个所述属性信息的各属性值,确定所述智能设备能够配置的多个属性值组,将已配置的第一文本信息及所述多个属性值组发送给所述TTS服务器。 8.一种语音播报装置,其特征在于,应用于智能设备,所述装置包括: 发送模块,用于若所述智能设备与从文本到语音TTS服务器的网络连通,将已配置的第一文本信息及表征所述智能设备语音播报的属性信息的至少一个属性值组发送给所述TTS服务器; 接收模块,用于接收并保存所述TTS服务器返回的音频文件,其中,所述音频文件是所述TTS服务器根据所述第一文本信息和所述属性值组进行语音合成得到的; 处理模块,用于若确定需要进行语音播报,则在已保存的音频文件中查找对应的目标音频文件,并控制所述智能设备播放所述目标音频文件。 9.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7任一所述方法的步骤。 10.一种计算机可读存储介质,其特征在于,其存储有可由终端执行的计算机程序,当所述程序在所述终端上运行时,使得所述终端执行权利要求1-7任一项所述方法的步骤。