基于条件生成式对抗网络的情感语音生成模型
提出了一种基于条件生成对抗网络的情感语音生成技术,在引入情感条件的基础上,通过学习语音库中的情感信息,能够自主生成全新的富有指定情感的语音.生成式对抗网络是由一个判别网络和一个生成器组成.使用TensorFlow作为学习框架,利用条件GAN模型对大量情感语音进行训练,利用语音生成网络G和生成网络D构成动态"博弈过程",更好地学习观测语音情感数据的条件分布.其生成样本接近原始学习内容的自然语音信号,具有多样性,而且能够逼近符合真实情感的语音数据.所提出的解决方案在交互式情绪二进制动作捕捉IEMOCAP语料库和自建情感语料库上进行评估,并且与现有情感语音生成算法相比显示出提供更准确的结果.
条件生成式对抗网络;条件GAN模型;情感判别;语音生成模型;TensorFlow框架
31
辽宁省教育厅校际合作项目;大连市科技计划
2022-01-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
322-326