一种基于流形的语音情感识别方法
本发明提供一种基于流形的语音情感识别方法,包含以下步骤:提取测试语句语音特征:MFCC、LPCC、LFPC、ZCPA、PLP和RASTA-PLP;计算所提取语音特征的局部均值、方差,并计算所提取语音特征一阶差分的局部均值、方差,并将它们串接,构成测试语句的局部统计特征;采用通用背景模型UBM和测试语句的局部统计特征,生成测试语句的特定高斯混合模型GMM,再将GMM的所有均值连接成向量作为该测试语句的特征向量;通过集成特征选择算法和多集群特征选择算法MCFS选择的特征,变换测试语句的特征向量;采用支持向量机分类模型,以特征选择后的测试语句的特征向量为输入,分类测试语句的情感类别。本发明的方法,其语音情感识别的准确度高。
发明专利
CN201310383093.6
2013-08-28
CN103440863A
2013-12-11
G10L15/02(2006.01)I
华南理工大学
文贵华;孙亚新;李辉辉
510640 广东省广州市天河区五山路381号
广州市华学知识产权代理有限公司 44245
蔡茂略
广东;44
一种基于流形的语音情感识别方法,包含以下顺序的步骤:(1)提取测试语句的以下语音特征:MFCC、LPCC、LFPC、ZCPA、PLP和RASTA‑PLP;(2)计算所提取语音特征的局部均值、方差,并计算所提取语音特征一阶差分的局部均值、方差,并将它们串接,构成测试语句的局部统计特征;(3)采用在所有训练样本局部统计特征向量集合中学习获得的通用背景模型UBM和测试语句的局部统计特征,生成测试语句的特定高斯混合模型GMM,再将GMM的所有均值连接成向量作为该测试语句的特征向量;(4)通过集成特征选择算法和多集群特征选择算法MCFS选择的特征,变换测试语句的特征向量;(5)采用支持向量机分类模型,以特征选择后的测试语句的特征向量为输入,分类测试语句的情感类别。