基于深度卷积生成对抗网络的语音生成技术

引用

摘要：

提出了一种基于深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)的语音生成技术,通过大量学习语音库,能够自主生成全新的语音.生成式对抗网络是一种近年来大热的深度学习模型,其由一个判别网络(Discriminator,D)和一个生成网络(Generator,G)组成.使用Tensorflow作为学习框架,利用DCGAN模型对大量语音进行训练.在基本训练过程中,语音生成网络G的目标就是尽量生成真实的、接近自然的语音去欺骗语音判别网络D,而D的目标就是尽量把G生成的语音和真实的语音区分出来,语音生成网络努力生成的语音让判别网络认为是真实的语音,利用G和D构成动态“博弈过程”,最终生成接近原始学习内容的自然语音信号,实现语音的自动生成.

关键词：深度学习、人工智能、生成对抗网络、语音生成

分类号：TP181(自动化基础理论)

资助基金：江苏省高等学校大学生创新创业训练计划201610312053X

在线出版日期：2018-04-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：13-15,20

英文信息展示

期刊专题