10.14135/j.cnki.1006-3080.20210225007
基于宽深学习网络的音乐情感识别
将梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和残差相位(Residual Phase,RP)进行加权结合来提取音乐情感特征,提高了音乐情感特征的挖掘效率;同时为了提高音乐情感的分类精度,缩短模型训练时间,将长短期记忆网络(Long Short-Term Memory,LSTM)和宽度学习系统(Broad Learning System,BLS)相结合,使用LSTM作为BLS的特征映射节点,搭建了一种新型宽深学习网络(LSTM-BLS)进行音乐情感识别分类训练.在Emotion数据集上的实验结果表明,本文算法取得了比其他复杂网络更高的识别准确率,为音乐情感识别的发展提供了新的可行性思路.
音乐情感识别、残差相位、宽度学习、深度学习、长短期记忆网络
48
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;上海市自然科学基金
2022-07-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
373-380