基于信息提炼与残差特征聚合网络的单通道语音增强
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.16798/j.issn.1003-0530.2023.07.015

基于信息提炼与残差特征聚合网络的单通道语音增强

引用
针对语音增强的深层神经网络中对丰富的全局语音相关信息提取困难、未充分利用中间层次特征的问题,本文以尽可能小的参数为前提,基于注意力U型网络,设计了一种基于信息提炼和残差特征聚合的新型卷积编解码网络来进行语音增强.本文在编解码部分提出一种2维的层次细化残差(HRR,Hierarchical Refinement Residual)模块,该模块能显著降低训练参数并扩大感受野,对多尺度上下文信息进行不同层次的提取;传输层提出一种轻量级的1维通道自适应注意力(1D-CAA,One-Dimensional Channel Dimension Adaptive Attention)模块,结合门控机制和范数归一化,选择性地传递特征并提高网络表达能力,并联合门控残差线性单元搭建了一种门控残差特征聚合(GRFA,Gating Residual Feature Aggregation)网络,增强了层间信息流动并充分利用中间层次特征细节,获取更多时序相关信息.实验部分,本文在21种噪声环境下训练和测试,最终以1.23×106的参数相比于其他方法取得更优的客观与主观指标,具备较强的增强效果与泛化能力,并在模型复杂度与精度上取得良好平衡.

语音增强、多尺度上下文、自适应注意力机制、残差特征聚合

39

TN911.7

国家自然科学基金;国家自然科学基金;国家自然科学基金;国家自然科学基金;信号与信息处理重庆市市级重点实验室建设项目;重庆市自然基金项目;重庆市教育委员会科研项目;重庆市教育委员会科研项目

2023-07-31(万方平台首次上网日期,不代表论文的发表时间)

共14页

1285-1298

相关文献
评论
暂无封面信息
查看本期封面目录

信号处理

1003-0530

11-2406/TN

39

2023,39(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn