10.3969/j.issn.1007-130X.2016.09.031
采用STRAIGHT模型和深度信念网络的语音转换方法
提出一种将STRAIGHT模型和深度信念网络DBN相结合实现语音转换的方式.首先,通过STRAIGHT模型提取出源说话人和目标说话人的语音频谱参数,用提取的频谱参数分另训练两个DBN得到语音高阶空间的个性特征信息;然后,用人工神经网络ANN将两个具有高阶特征的空间连接并进行特征转换;最后,用基于目标说话人数据训练出的DBN来对转换后的特征信息进行逆处理得到语音频谱参数,并用STRAIGHT模型合成具有目标说话人个性化特征的语音.实验结果表明,采用此种方式获得的语音转换效果要比传统的采用GMM实现语音转换更好,转换后的语音音质和相似度与目标语音更接近.
语音转换、STRAIGHT模型、深度信念网络、高阶空间
38
TN912.3
住房城乡建设部科学技术项目计划2016-R2-045;西安市碑林区2014年科技计划项目GX1412
2016-10-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
1950-1954