DOI：10.3969/j.issn.1000-1220.2019.02.035

神经网络声码器的话者无关与自适应训练方法研究

引用

摘要：

近年来出现的基于WaveNet 的神经网络声码器可以取得较高的重构语音质量,但其采用的话者相关模型训练方法对于目标发音人语音数据量依赖较大. 因此,本文研究目标发音人语音数据量受限情况下的神经网络声码器训练方法. 首先利用多发音人数据训练话者无关声码器模型,进一步利用少量目标发音人数据对话者无关模型进行自适应更新,以得到目标发音人的神经网络声码器模型. 本文实验对比了自适应训练中局部更新与全局更新两种策略,以及自适应与话者相关两种训练方法.实验表明,本文方法构建的神经网络声码器可以取得优于STRAIGHT 声码器的重构语音质量,在目标发音人数据量受限的情况下,该方法相对话者相关训练也可以取得更好的客观和主观性能表现.

关键词：神经网络、WaveNet、声码器、话者无关模型、自适应训练

所属期刊栏目：40

分类号：TP391(计算技术、计算机技术)

资助基金：安徽省科技重大专项17030901005 资助

在线出版日期：2019-05-31（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：445-450

英文信息展示

期刊专题