一种基于稀疏表示的短语音说话人识别方法

引用

摘要：

本发明公开了一种基于稀疏表示的短语音说话人识别方法，属于语音信号处理与模式识别技术领域，其旨在决现有方法在语音数据有限条件下识别率低的问题。其主要包括以下步骤：①对所有语音样本预处理，然后提取梅尔倒谱系数及其一阶差分系数作为特征；②由背景语音库训练高斯背景模型，并提取高斯超向量作为二次特征；③将训练语音样本的高斯超向量排列在一起构成字典；④利用稀疏求解算法求解表示系数，并重构信号，根据最小化残差确定识别结果。本发明经自适应得到的高斯超向量，能够极大地缓解语音数据有限带来说话人个性特征表现不足的问题；利用稀疏表示的重构残差进行分类，能够处理语义信息不匹配导致的说话人模型失配的问题。

专利类型：发明专利

申请/专利号：CN201310319824.0

申请日期：2013-07-26

公开/公告号：CN103345923A

公开/公告日：2013-10-09

主分类号：G10L17/00(2013.01)I

申请/专利权人:电子科技大学

发明/设计人:程建;黎兰;苏靖峰;周圣云;李鸿升

主申请人地址:611731 四川省成都市高新区（西区）西源大道2006号

专利代理机构:成都华典专利事务所(普通合伙) 51223

代理人:徐丰%杨保刚

国别省市代码:四川;51

权利要求：

一种基于稀疏表示的短语音说话人识别方法，其特征在于，包括以下步骤：步骤一：对所有语音样本预处理，主要包括预加重、分帧加窗、端点检测，然后提取梅尔倒谱系数及其一阶差分系数作为特征；步骤二：由背景语音库训练高斯背景模型，并提取高斯超向量作为二次特征；步骤三：将训练语音样本的高斯超向量排列在一起构成字典；步骤四：利用稀疏求解算法求解表示系数，并重构信号，根据最小化残差确定识别结果。

专利专题