一种语音合成方法、语音合成装置及智能设备
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

一种语音合成方法、语音合成装置及智能设备

引用
本申请公开了一种语音合成方法、装置、智能设备及计算机可读存储介质。其中,该方法包括:基于预设的分词算法对输入文本进行分词处理,获得中文词语列表及英文单词列表;确定中文词语列表中的每个中文词语所分别对应的拼音,并基于预设的单词前缀词典查找英文单词列表中的每个英文单词所分别对应的音素;若存在目标英文单词,则根据目标英文单词在输入文本中的出现频率,确定目标音素获取方式;基于目标音素获取方式获得目标英文单词所对应的音素;根据各个中文词语的拼音及各个英文单词的音素,进行输入文本的语音合成。通过本申请方案,可提升智能设备在面对中英文混合文本时的语音合成效果。

发明专利

CN202011376470.X

2020-11-30

CN112530402A

2021-03-19

G10L13/02(2013.01)

深圳市优必选科技股份有限公司

钱程浩

518000 广东省深圳市南山区学苑大道1001号南山智园C1栋16、22楼

深圳中一联合知识产权代理有限公司

肖遥

广东;44

1.一种语音合成方法,其特征在于,包括: 基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表,其中,所述中文词语列表包括组成所述输入文本的各个中文词语,所述英文单词列表包括组成所述输入文本的各个英文单词; 确定所述中文词语列表中的每个中文词语所分别对应的拼音; 基于预设的单词前缀词典查找所述英文单词列表中的每个英文单词所分别对应的音素,其中,所述单词前缀词典配置有至少一个英文单词及对应的音素; 若存在目标英文单词,则根据所述目标英文单词在所述输入文本中的出现频率,确定所述目标英文单词的目标音素获取方式; 基于所述目标音素获取方式获得所述目标英文单词所对应的音素; 根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,进行所述输入文本的语音合成。 2.如权利要求1所述的语音合成方法,其特征在于,所述根据所述目标英文单词在所述输入文本中的出现频率,确定所述目标英文单词的目标音素获取方式,包括: 根据所述目标英文单词在所述输入文本中的出现频率,确定所述目标英文单词是否为高频单词; 若所述目标英文单词为高频单词,则将预设的第一音素获取方式确定为所述目标英文单词的目标音素获取方式,其中,所述第一音素获取方式依赖于人工; 若所述目标英文单词不为高频单词,则将预设的第二音素获取方式确定为所述目标英文单词的目标音素获取方式,其中,所述第二音素获取方式不依赖于人工。 3.如权利要求2所述的语音合成方法,其特征在于,若所述目标英文单词的目标音素获取方式为所述第一音素获取方式,则所述基于所述目标音素获取方式获得所述目标英文单词所对应的音素,包括: 基于所述目标英文单词输出提醒消息,所述提醒消息用于提醒用户基于所述目标英文单词输入对应的音素; 将接收到的基于所述目标英文单词而输入的音素确定为所述目标英文单词所对应的音素。 4.如权利要求3所述的语音合成方法,其特征在于,在所述将接收到的基于所述目标英文单词而输入的音素确定为所述目标英文单词所对应的音素之后,所述语音合成方法还包括: 将所述目标英文单词及所述目标英文单词所对应的音素添加到所述单词前缀词典中,以实现所述单词前缀词典的更新。 5.如权利要求2所述的语音合成方法,其特征在于,若所述目标英文单词的目标音素获取方式为所述第二音素获取方式,则所述基于所述目标音素获取方式获得所述目标英文单词所对应的音素,包括: 将所述目标英文单词输入至字素到音素模型; 将所述字素到音素模型所输出的音素确定为所述目标英文单词所对应的音素。 6.如权利要求1所述的语音合成方法,其特征在于,所述根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,进行所述输入文本的语音合成,包括: 根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,生成所述输入文本的发音列表; 将所述发音列表输入至预设的语音合成系统,以指示所述语音合成系统基于所述发音列表对所述输入文本进行语音合成。 7.如权利要求1至6任一项所述的语音合成方法,其特征在于,在所述基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表之后,所述语音合成方法还包括: 基于所述输入文本对所述中文词语列表中的每个中文词语进行词性标注,获得每个中文词语的词性; 相应地,所述确定所述中文词语列表中的每个中文词语所分别对应的拼音,包括: 基于所述中文词语列表中的每个中文词语的词性,确定每个中文词语所分别对应的拼音。 8.一种语音合成装置,其特征在于,应用于智能设备,包括: 文本分词单元,用于基于预设的分词算法,对输入文本进行分词处理,获得中文词语列表及英文单词列表,其中,所述中文词语列表包括组成所述输入文本的各个中文词语,所述英文单词列表包括组成所述输入文本的各个英文单词; 拼音确定单元,用于确定所述中文词语列表中的每个中文词语所分别对应的拼音; 第一音素确定单元,用于基于预设的单词前缀词典查找所述英文单词列表中的每个英文单词所分别对应的音素,其中,所述单词前缀词典配置有至少一个英文单词及对应的音素; 获取方式确定单元,用于若存在目标英文单词,则根据所述目标英文单词在所述输入文本中的出现频率,确定所述目标英文单词的目标音素获取方式; 第二音素确定单元,用于基于所述目标音素获取方式获得所述目标英文单词所对应的音素; 语音合成单元,用于根据所述中文词语列表中的每个中文词语所分别对应的拼音,以及所述英文单词列表中的每个英文单词所分别对应的音素,进行所述输入文本的语音合成。 9.一种智能设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。 10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
相关文献
评论
法律状态详情>>
2021-03-19公开
2021-03-19公开
相关作者
相关机构