10.16798/j.issn.1003-0530.2021.01.007
基于FFTNet-GAN的音频超分辨率方法研究
本文提出了一种基于FFTNet的生成对抗网络模型来实现极端音频超分辨率任务.生成器采用并行、非因果、Non-local运算的三路分裂求和FFTNet,此浅层模型速度快,精度高,能更好的提取时域音频的长期相关结构,以期望分辨率提取特征,提升重建性能;设计匹配性能的判别器,稳定适应生成对抗架构;融合基于频域的感知损失,与样本空间损失固定加权减少重建失真和提高感知质量.从主客观进行系统评价,本文方法都优于基线模型,从2x/4x/6x倍还原效果来看,模型具有极端的高频重建能力,有助于提高音频信号的时间分辨率.
音频超分辨率、带宽扩展、FFTNet、生成对抗网络、高频重建
37
TP912
福建省科技重大专项;福建省自然科学基金项目;福建省高校产学研合作科技重大项目;华侨大学中青年教师科技创新资助计划项目
2021-03-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
59-65