10.3969/j.issn.1002-0802.2021.04.012
基于深度迁移学习的跨库语音情感识别
语音是信息传递的载体.情感作为语音携带的一种突出的信息,左右了语言的释义.在对现有语音情感识别方法进行研究的基础上,提出一个深度迁移网络——基于注意力机制的长短时动态对抗适配网络(Attention-based LSTM Dynamic Adversarial Adaptation Networks,LSTM-TF-at-DAAN)进行跨库语音情感识别.在语音情感识别领域广泛使用的eNTERFACE语音库和EMO-DB语音库上进行实验,并将实验结果与采用一般迁移学习方法的实验结果进行对比,发现LSTM-TF-at-DAAN提升了5.37% 的识别准确率,为深度迁移学习应用于跨库语音情感识别提供了可行性证明.
语音情感识别、深度迁移学习、类别不平衡库、长短时注意力机制、动态对抗适配
54
TP391;TP183(计算技术、计算机技术)
2021-05-18(万方平台首次上网日期,不代表论文的发表时间)
共5页
848-852