基于自编码特征的语音增强声学特征提取*

引用

摘要：

利用监督性学习算法进行语音增强时,特征提取是至关重要的步骤.现有的组合特征和多分辨率特征等听觉特征是常用的声学特征,基于这些特征的增强语音虽然可懂度得到了较大提升,但是仍然残留大量噪声,语音质量(用信噪比衡量)很低.在不影响可懂度的情况下,为了提高语音增强后语音质量,提出了一种基于自编码特征的综合特征.首先利用自编码器提取自编码特征,然后利用Group Lasso算法验证自编码特征与听觉特征的互补性和冗余性,将特征重新组合得到综合特征,最后将综合特征作为语音增强系统的输入特征进行语音增强.在TIMIT语料库和Noisex-92噪声库上进行了仿真实验,结果表明,与传统的语音增强方法以及现有的组合特征和多分辨率特征分别作为语音增强系统输入特征的深度学习等方法相比,提出的增强算法的语音质量得到了较大提升.

关键词：自编码特征、深度神经网络、特征提取、信噪比

所属期刊栏目：13

分类号：TP391(计算技术、计算机技术)

资助基金：The Science and Technology Support Program of Tianjin under Grant No. 16YFZCGX00760

在线出版日期：2019-09-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：1341-1350

英文信息展示

期刊专题