10.3969/j.issn.1672-9870.2020.01.013
基于深度卷积网络和谱图的语音情感识别
针对弥合语音信号与主观情绪之间的情感鸿沟,传统的方法没有足够的区分度来描述主观情绪,特征提取效果并不理想.因此提出了一种基于卷积神经网络和谱图来对语音情感进行识别的方法,通过语音信号生成相关的对数Mel谱图,输入到深度卷积网络模型中,且该模型主要是由三个卷积层和两个完全连接层所构成,谱图通过模型训练提取相关特征并输出七种预测结果.实验结果表明,基于新训练好的模型在特征提取上优于传统的方法,大部分情绪预测的准确率能达到65%,与之前相比,提高了大约10%,所以该方法能够以在语音情感的识别上取得了不错的效果.
卷积神经网络、语音情感识别、特征提取
43
TP751.1(遥感技术)
吉林省科技厅项目20160204009GX , 20170623004TC;国家科技部项目2018YFB1107600
2020-04-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
76-81