DOI：10.3969/j.issn.1007-130X.2016.09.031

采用STRAIGHT模型和深度信念网络的语音转换方法

引用

摘要：

提出一种将STRAIGHT模型和深度信念网络DBN相结合实现语音转换的方式.首先,通过STRAIGHT模型提取出源说话人和目标说话人的语音频谱参数,用提取的频谱参数分另训练两个DBN得到语音高阶空间的个性特征信息;然后,用人工神经网络ANN将两个具有高阶特征的空间连接并进行特征转换;最后,用基于目标说话人数据训练出的DBN来对转换后的特征信息进行逆处理得到语音频谱参数,并用STRAIGHT模型合成具有目标说话人个性化特征的语音.实验结果表明,采用此种方式获得的语音转换效果要比传统的采用GMM实现语音转换更好,转换后的语音音质和相似度与目标语音更接近.

关键词：语音转换、STRAIGHT模型、深度信念网络、高阶空间

所属期刊栏目：38

分类号：TN912.3

资助基金：住房城乡建设部科学技术项目计划2016-R2-045;西安市碑林区2014年科技计划项目GX1412

在线出版日期：2016-10-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：1950-1954

英文信息展示

期刊专题