一种基于稀疏表示的短语音说话人识别方法
本发明公开了一种基于稀疏表示的短语音说话人识别方法,属于语音信号处理与模式识别技术领域,其旨在决现有方法在语音数据有限条件下识别率低的问题。其主要包括以下步骤:①对所有语音样本预处理,然后提取梅尔倒谱系数及其一阶差分系数作为特征;②由背景语音库训练高斯背景模型,并提取高斯超向量作为二次特征;③将训练语音样本的高斯超向量排列在一起构成字典;④利用稀疏求解算法求解表示系数,并重构信号,根据最小化残差确定识别结果。本发明经自适应得到的高斯超向量,能够极大地缓解语音数据有限带来说话人个性特征表现不足的问题;利用稀疏表示的重构残差进行分类,能够处理语义信息不匹配导致的说话人模型失配的问题。
发明专利
CN201310319824.0
2013-07-26
CN103345923A
2013-10-09
G10L17/00(2013.01)I
电子科技大学
程建;黎兰;苏靖峰;周圣云;李鸿升
611731 四川省成都市高新区(西区)西源大道2006号
成都华典专利事务所(普通合伙) 51223
徐丰%杨保刚
四川;51
一种基于稀疏表示的短语音说话人识别方法,其特征在于,包括以下步骤:步骤一:对所有语音样本预处理,主要包括预加重、分帧加窗、端点检测,然后提取梅尔倒谱系数及其一阶差分系数作为特征;步骤二:由背景语音库训练高斯背景模型,并提取高斯超向量作为二次特征;步骤三:将训练语音样本的高斯超向量排列在一起构成字典;步骤四:利用稀疏求解算法求解表示系数,并重构信号,根据最小化残差确定识别结果。