10.13700/j.bh.1001-5965.2019.0491
基于高分辨率网络的单声道歌声分离
单声道歌声分离是指将单声道歌曲中的伴奏和歌声分离,在旋律提取、歌词识别、卡拉OK伴奏等方面有重要应用.针对当前时频谱图预测精度受限的问题,利用高分辨率网络具有并行结构及特征充分交互提高模型性能的优势,提出基于高分辨率网络的单声道歌声分离算法.设计并构建适合单声道歌声分离的高分辨率网络,输入歌曲的时频谱图到网络,得到预测的伴奏和歌声时频谱图.结合歌曲相位进行重构,得到伴奏和歌声的时域信号.实验表明,在公开数据集MIR-1K上,所提算法的SNR、SIR、SAR指标均优于当前代表性算法,提高了分离后伴奏和歌声的质量.
单声道歌声分离、深度学习、时频谱图、高分辨率网络、频域模型
46
TP391(计算技术、计算机技术)
国家重点研发计划;国家自然科学基金
2020-09-04(万方平台首次上网日期,不代表论文的发表时间)
共9页
1555-1563