10.3969/j.issn.1673-629X.2018.11.028
语音与文本情感识别中愤怒与开心误判分析
在语音情感识别的研究中发现,愤怒与开心之间通过语音信息较难区分,文中将结合文本信息对这两种情感进行区分,以提高其识别率.使用IEMOCAP与SAVEE数据集中语音数据提取声学特征,分别使用卷积神经网络与支持向量机训练分类器模型,对中性、愤怒、开心、悲伤四类情感进行识别,对情感之间误判情况以及识别准确率进行分析,验证了语音通道信息对于愤怒与开心容易产生误判的结论.为解决此问题,加入文本信息,训练文本识别模型,有效解决了愤怒与开心的误判情况.同时发现两通道信息对情感识别的不同影响,在声音中包含更多利于识别愤怒和悲伤情感的信息;在文本中包含更多利于识别中性与开心情感的信息.声音情感识别中,愤怒/开心之间易误判,愤怒/悲伤之间易区分.文本情感识别中,愤怒/开心之间易区分,愤怒/悲伤之间易误判.声学与文本特征融合后,情感识别准确率相比单一通道明显提高,两通道信息对于情感识别具有互补作用.
情感识别、声学特征、文本特征、混淆矩阵
28
TP18(自动化基础理论)
中国国家社会科学基金会项目BCA150054
2018-12-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
124-127,134