基于深度卷积生成对抗网络的语音生成技术
提出了一种基于深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)的语音生成技术,通过大量学习语音库,能够自主生成全新的语音.生成式对抗网络是一种近年来大热的深度学习模型,其由一个判别网络(Discriminator,D)和一个生成网络(Generator,G)组成.使用Tensorflow作为学习框架,利用DCGAN模型对大量语音进行训练.在基本训练过程中,语音生成网络G的目标就是尽量生成真实的、接近自然的语音去欺骗语音判别网络D,而D的目标就是尽量把G生成的语音和真实的语音区分出来,语音生成网络努力生成的语音让判别网络认为是真实的语音,利用G和D构成动态“博弈过程”,最终生成接近原始学习内容的自然语音信号,实现语音的自动生成.
深度学习、人工智能、生成对抗网络、语音生成
TP181(自动化基础理论)
江苏省高等学校大学生创新创业训练计划201610312053X
2018-04-12(万方平台首次上网日期,不代表论文的发表时间)
共4页
13-15,20