10.3969/j.issn.1006-9348.2021.12.042
HMM与神经网络相融合的低资源语音合成方法
为了提高语音合成自然度和稳定性,提出HMM与深度神经网络相融合的,以维吾尔语作为实验语言的语音合成方法.基于深度学习的端到端语音合成方法存在生成速度慢、稳定性及可控性不够好,但是合成语音自然度高,而基于HMM的方法系统稳定性好,合成语音自然度不如端到端的方法.因此,系统前端部分利用HMM(马尔科夫模型)获取维吾尔语固有的语言特征,后端合成部分利用深度神经网络框架建立自回归模型.前端文本分析用HMM模型获取语言特征,后端合成用不同的神经网路模型,并进行了对比试验.最后对于实验结果进行了评测.实验结果验证了基于HMM+BiLSTM的语音合成方法的效果最好.
神经网络;语音合成;低资源;语言特征
38
TP391.1(计算技术、计算机技术)
自治区天池博士计划40050095
2022-01-17(万方平台首次上网日期,不代表论文的发表时间)
共9页
203-211