DOI：10.3969/j.issn.1006-6403.2015.06.015

基于深度神经网络的语音增强研究

引用

摘要：

由于目前语音增强方法或算法难以对语音频谱在时频域上的结构化信息进行有效建模和利用。然而，深度学习中的RBM、DNN等模型擅长对数据中的结构化信息进行建模，而且具有从数据的低层结构化信息提取更高层的结构化信息的能力。基于分类深度神经网络的语音增强，该方法对于低信噪比非平稳语音增强可得到高可懂度的增强语音，但语音音质损失严重。基于DNN的最小均方误差回归拟合语音增强方案，该语音增强方案还说明大语音数据训练能保证DNN较充分学习到噪声语音谱和干净语音谱之间复杂的非线性关系。

关键词：深度学习、语音增强、人工神经网络

分类号：TP3;TN9

资助基金：新一代宽带无线移动通信网国家科技重大专项2012ZX03001012

在线出版日期：2015-08-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：62-64,70

期刊专题