10.3778/j.issn.1673-9418.1309002
融合功能性副语言的语音情感识别新方法
针对声音突发特征(笑声、哭声、叹息声等,称之为功能性副语言)携带大量情感信息,而包含这类突发特征的语句由于特征突发性的干扰整体情感识别率不高的问题,提出了融合功能性副语言的语音情感识别方法。该方法首先对待识别语句进行功能性副语言自动检测,根据检测结果将功能性副语言从语句中分离,从而得到较为纯净的两类信号:功能性副语言信号和传统语音信号,最后将两类信号的情感信息使用自适应权重融合方法进行融合,从而达到提高待识别语句情感识别率和系统鲁棒性的目的。在包含6种功能性副语言和6种典型情感的情感语料库上的实验表明:该方法在与人无关的情况下得到的情感平均识别率为67.41%,比线性加权融合、Dempster-Shafer(DS)证据理论、贝叶斯融合方法分别提高了4.2%、2.8%和2.4%,比融合前平均识别率提高了8.08%,该方法针对非特定人语音情感识别具有较好的鲁棒性及识别准确率。
语音情感识别、功能性副语言、自动检测、自适应权重、融合识别
TP391(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant No.61272211;the Natural Science Foundation of Jiangsu Province of China under Grant No. BK2011521;the Senior Talent Foundation of Jiangsu University under Grant No.10JDG065
2014-02-22(万方平台首次上网日期,不代表论文的发表时间)
共14页
186-199