文本到语音的系统
一种文本到语音的方法,其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音,该方法包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的说话者;选择用于所输入的文本的说话者属性;使用声学模型,将声学单元序列转换成语音向量序列;输出语音向量序列,作为具有所选择的说话者声音和所选择的说话者属性的音频,其中,所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数,第一组和第二组参数没有重叠,选择说话者声音包括从第一组参数中选择给出说话者声音的参数,选择说话者属性包括从第二组参数中选择给出所选择的说话者属性的参数。
发明专利
CN201310110148.6
2013-04-01
CN103366733A
2013-10-23
G10L13/08(2013.01)I
株式会社 东芝
赤岭政巳;L-M·哈维尔;W·V·P·梁;C·K·康;G·M·J·弗朗西斯;K·K·马里
日本东京都
北京市中咨律师事务所 11247
刘薇%杨晓光
日本;JP
一种文本到语音的方法,其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音,所述方法包括:输入文本;将所输入的文本划分成声学单元序列;选择用于所输入的文本的说话者;选择用于所输入的文本的说话者属性;使用声学模型,将所述声学单元序列转换成语音向量序列;输出所述语音向量序列,作为具有所选择的说话者声音和所选择的说话者属性的音频;其中,所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数,其中,所述第一组参数和所述第二组参数没有重叠;其中,选择说话者声音包括:从所述第一组参数中选择给出所述说话者声音的参数;选择说话者属性包括:从所述第二组参数中选择给出所选择的说话者属性的参数。