基于生成对抗网络的语音信号分离

引用

摘要：

基于深度学习的单声道语音分离需要计算时频掩蔽,但现有语音分离方法中时频掩蔽不可学习,也未将其封装到深度学习中进行优化,通常依赖于维纳滤波法进行后续处理.为此,提出一种基于生成对抗网络的语音信号分离方法.在语音生成阶段引入递归推导算法和稀疏编码器来改进时频掩蔽生成结果,并将生成的语音输入至判别器进行分类,以降低信号源之间的扰动.实验结果表明,与基于深度神经网络的语音信号分离方法相比,该方法的 SDR、SIR分离指标分别提高6.2 dB 和5.0 dB.

关键词：单声道语音分离、生成对抗网络、时频掩蔽、递归推导、稀疏编码器

所属期刊栏目：46

分类号：TP391(计算技术、计算机技术)

资助基金：广东省科技计划项目;佛山市产学研专项资金项目

在线出版日期：2020-03-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：302-308

英文信息展示

期刊专题