DOI：10.11896/j.issn.1002-137X.2015.9.005

基于声学特征的语言情感识别

引用

摘要：

语音情感识别是语音处理领域中一个具有挑战性和广泛应用前景的研究课题.探索了语音情感识别中的关键问题之一:生成情感识别的有效的特征表示.从4个角度生成了语音信号中的情感特征表示:(1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征;(2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征;(3)声学特征依据声学词典进行转化而得出的特征;(4)声学特征转化为高斯超向量的特征.通过实验比较了各类特征在情感识别上的独立性能,并且尝试了将不同的特征进行融合,最后比较了不同的声学特征在几个不同语言的情感数据集上的效果(包括IEMOCAP英语情感语料库、CASIA汉语情感语料库和Berlin德语情感语料库).在IEMOCAP数据集上,系统的正确识别率达到了71.9％,超越了之前在此数据集上报告的最好结果.

关键词：语音情感识别、声学特征、特征融合

所属期刊栏目：42

分类号：TP391(计算技术、计算机技术)

资助基金：北京市自然科学基金4142029;中国人民大学科学研究基金中央高校基本科研业务费专项资金14XNLQ01

在线出版日期：2015-10-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：24-28

英文信息展示

期刊专题