10.14135/j.cnki.1006-3080.20191029002
基于音频内容和歌词文本相似度融合的翻唱歌曲识别模型
翻唱歌曲识别是音乐信息检索(Music Information Retrieval,MIR)领域最具挑战性的任务之一.为了提高翻唱歌曲识别(Cover Song Identification,CSI)的准确率,研究者提出了多音频特征相似度张量积图融合的翻唱识别模型,但相似度高维空间几何结构的学习大幅度增加了模型的时间复杂度,同时该模型没有考虑歌词对翻唱识别的重要性.本文提出了基于音频内容和歌词文本相似度融合的翻唱识别模型.采用深度学习的方法分别提取音频特征和歌词特征,并采用相似度网络融合模型对这两种特征的相似度进行融合.为了验证算法的有效性,构建了Covers2326多模态数据库.实验结果表明,与基于多音频特征相似度张量积图融合模型相比,本文模型取得了更高的识别准确率和更低的时间复杂度.
多模态、深度学习、相似度融合、翻唱歌曲识别
47
TP391(计算技术、计算机技术)
国家自然科学基金面上项目61771196
2021-03-04(万方平台首次上网日期,不代表论文的发表时间)
共7页
74-80