声音合成模型生成装置、声音合成模型生成系统、通信终端以及声音合成模型生成方法
本发明提供能够适当地取得用户声音的声音合成模型生成装置、声音合成模型生成系统、通信终端以及声音合成模型生成方法。声音合成模型生成系统(1)构成为包含移动通信终端(2)和声音合成模型生成装置(3)。移动通信终端(2)具有从所输入的声音提取声音特征量的特征量提取部(201)、以及从声音取得文本数据的文本数据取得部(202)。声音合成模型(3)具有:声音合成模型生成部(301),其根据由学习信息取得部(200)取得的特征量和文本数据生成声音合成模型;图像信息生成部(307),其根据基于特征量和文本数据的参数生成图像信息;以及信息输出部(309),其将图像信息发送到移动通信终端(2)。
发明专利
CN200980126843.3
2009-07-07
CN102089804A
2011-06-08
G10L13/00(2006.01)I
株式会社NTT都科摩
水口纪子
日本东京都
北京三友知识产权代理有限公司 11127
李辉%马建军
日本;JP
一种声音合成模型生成装置,其特征在于,该声音合成模型生成装置具有:学习信息取得单元,其取得用户声音的特征量以及与所述声音对应的文本数据;声音合成模型生成单元,其根据由所述学习信息取得单元取得的所述特征量和所述文本数据进行学习,生成声音合成模型;参数生成单元,其生成由所述声音合成模型生成单元生成的所述声音合成模型的表示学习程度的参数;图像信息生成单元,其根据由所述参数生成单元生成的所述参数,生成用于向用户显示图像的图像信息;以及图像信息输出单元,其输出由所述图像信息生成单元生成的所述图像信息。