一种基于流形的语音情感识别方法

引用

摘要：

本发明提供一种基于流形的语音情感识别方法，包含以下步骤：提取测试语句语音特征：MFCC、LPCC、LFPC、ZCPA、PLP和RASTA-PLP；计算所提取语音特征的局部均值、方差，并计算所提取语音特征一阶差分的局部均值、方差，并将它们串接，构成测试语句的局部统计特征；采用通用背景模型UBM和测试语句的局部统计特征，生成测试语句的特定高斯混合模型GMM，再将GMM的所有均值连接成向量作为该测试语句的特征向量；通过集成特征选择算法和多集群特征选择算法MCFS选择的特征，变换测试语句的特征向量；采用支持向量机分类模型，以特征选择后的测试语句的特征向量为输入，分类测试语句的情感类别。本发明的方法，其语音情感识别的准确度高。

专利类型：发明专利

申请/专利号：CN201310383093.6

申请日期：2013-08-28

公开/公告号：CN103440863A

公开/公告日：2013-12-11

主分类号：G10L15/02(2006.01)I

申请/专利权人:华南理工大学

发明/设计人:文贵华;孙亚新;李辉辉

主申请人地址:510640 广东省广州市天河区五山路381号

专利代理机构:广州市华学知识产权代理有限公司 44245

代理人:蔡茂略

国别省市代码:广东;44

权利要求：

一种基于流形的语音情感识别方法，包含以下顺序的步骤：（1）提取测试语句的以下语音特征：MFCC、LPCC、LFPC、ZCPA、PLP和RASTA‑PLP；（2）计算所提取语音特征的局部均值、方差，并计算所提取语音特征一阶差分的局部均值、方差，并将它们串接，构成测试语句的局部统计特征；（3）采用在所有训练样本局部统计特征向量集合中学习获得的通用背景模型UBM和测试语句的局部统计特征，生成测试语句的特定高斯混合模型GMM，再将GMM的所有均值连接成向量作为该测试语句的特征向量；（4）通过集成特征选择算法和多集群特征选择算法MCFS选择的特征，变换测试语句的特征向量；（5）采用支持向量机分类模型，以特征选择后的测试语句的特征向量为输入，分类测试语句的情感类别。

专利专题