10.13705/j.issn.1671-6841.2022166
基于时频复值特征的多尺度扩张DenseNet条件源分离网络
目前时频域音乐源分离方法大多基于幅度谱,这些方法忽略了相位信息而具有局限性.提出一种基于复值谱图的条件多尺度扩张密集卷积网络(C-MDilDenseNet)用于音乐源分离.首先,频谱图中时间轴和频率轴具有受音频速率和音调等独立影响而变化的声学特性,提出时频扩张密集块,有效增大了网络对频谱特征的感受野.其次,引入特征线性调制(FiLM)以扩展网络适应多源分离任务,并提出门控特征线性调制(GFiLM),从而更灵活、更有表现力地调节中间特征.最后,实验结果表明,在MUSDB18 数据集的音乐源分离任务上,所提出的网络模型与基准模型相比,平均信号失真比提高了0.49 dB,与现有一些时域和时频域分离方法相比,具有更好的分离性能且参数量相对较少.
音乐源分离、DenseNet、复值特征、GFiLM、扩张密集块
55
TP391(计算技术、计算机技术)
国家自然科学基金;湖南省研究生科研创新项目
2023-08-31(万方平台首次上网日期,不代表论文的发表时间)
共7页
60-66