文本到语音的系统

引用

摘要：

一种文本到语音的方法，其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音，该方法包括：输入文本；将所输入的文本划分成声学单元序列；选择用于所输入的文本的说话者；选择用于所输入的文本的说话者属性；使用声学模型，将声学单元序列转换成语音向量序列；输出语音向量序列，作为具有所选择的说话者声音和所选择的说话者属性的音频，其中，所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数，第一组和第二组参数没有重叠，选择说话者声音包括从第一组参数中选择给出说话者声音的参数，选择说话者属性包括从第二组参数中选择给出所选择的说话者属性的参数。

专利类型：发明专利

申请/专利号：CN201310110148.6

申请日期：2013-04-01

公开/公告号：CN103366733A

公开/公告日：2013-10-23

主分类号：G10L13/08(2013.01)I

申请/专利权人:株式会社东芝

发明/设计人:赤岭政巳;L-M·哈维尔;W·V·P·梁;C·K·康;G·M·J·弗朗西斯;K·K·马里

主申请人地址:日本东京都

专利代理机构:北京市中咨律师事务所 11247

代理人:刘薇%杨晓光

国别省市代码:日本;JP

权利要求：

一种文本到语音的方法，其被配置为输出具有所选择的说话者声音和所选择的说话者属性的语音，所述方法包括：输入文本；将所输入的文本划分成声学单元序列；选择用于所输入的文本的说话者；选择用于所输入的文本的说话者属性；使用声学模型，将所述声学单元序列转换成语音向量序列；输出所述语音向量序列，作为具有所选择的说话者声音和所选择的说话者属性的音频；其中，所述声学模型包括与说话者声音有关的第一组参数和与说话者属性有关的第二组参数，其中，所述第一组参数和所述第二组参数没有重叠；其中，选择说话者声音包括：从所述第一组参数中选择给出所述说话者声音的参数；选择说话者属性包括：从所述第二组参数中选择给出所选择的说话者属性的参数。

专利专题