一种基于声带特征参数的语音识别分类方法

引用

摘要：

本发明公开了一种基于声带特征参数的语音识别分类方法，首先搭建声带分层生物力学模型，以声带模型初始参数作为输入，求解声带耦合振动方程，输出声门波；同时采用迭代逆滤波算法获取实际嗓音信号中的声门波，构造两者关于时频域的目标函数以建立模型输出特征与嗓音信号之间的联系，匹配目标嗓音源，最终输出声带特征参数，将其与MFCC融合作为特征输入，对语音测试样本进行识别分类，确定测试样本类型。本发明根据声带分层生物力学模型提取了实际嗓音的声带特征参数，将基本声学特征与其融合，增加了语音声源信息，提高测试样本的识别率。

专利类型：发明专利

申请/专利号：CN202011198843.9

申请日期：2020-10-31

公开/公告号：CN112562650A

公开/公告日：2021-03-26

主分类号：G10L15/08(2006.01)

申请/专利权人:苏州大学

发明/设计人:张晓俊;周长伟;伍远博;吴迪;肖仲喆;陶智;赵鹤鸣

主申请人地址:215006 江苏省苏州市沧浪区干将东路333号

专利代理机构:南京经纬专利商标代理有限公司

代理人:朱小兵

国别省市代码:江苏;32

权利要求：

1.一种基于声带特征参数的语音识别分类方法，其特征在于，包括如下步骤： (1)、建立声带分层生物力学模型，通过增加质量块分离韧带层和肌肉层，表征喉部环甲肌与甲杓肌的张力作用，体现声带组织分层特性； (2)、定义模型的标准参数，并给定初始条件，求解声带分层生物力学模型的振动方程，获得声带振动位移以及声门气流流速； (3)、采用迭代逆滤波算法提取嗓音信号中的声门波信息，并建立目标函数； (4)、设计变异粒子群-拟牛顿算法反演目标嗓音的声带特征参数。 2.根据权利要求1所述的一种基于声带特征参数的语音识别分类方法，其特征在于，步骤(1)中，声带分层生物力学模型包括如下成分： (1)韧带层：质量块(m1r,m2r)，两者之间利用线性弹簧kcr进行耦合； (2)肌肉层：质量块m3r； (3)将韧带层侧向耦合到肌肉层的环甲肌张力：非线性弹簧(k1r,k2r)和粘性阻尼元素(r1r,r2r)； (4)将肌肉层耦合至刚性壁的甲杓肌张力：非线性弹簧k3r和粘性阻尼元素r3r。 3.根据权利要求1所述的一种基于声带特征参数的语音识别分类方法，其特征在于，步骤(2)中，建立声带的振动方程如下：式中，x代表各质量块振动位移向量；Ug为声门气流体速度，是分层三角声门模型的输出量；m,r,k分别为质量块的重量向量、阻尼向量和弹性向量；F为声带壁受到的气流压力；Ps,α分别为声门下压和预发声声门角；Apg为后声门间隙面积；对质量块上面的作用力进行空气动力学分析，忽略声门入门处的压力降以及声门内部的粘性损失，且假设伯努利气流只存在于声门最窄处amin以下，声门上压力近似为0即P0＝0，根据伯努利方程：式中，P1为声门上压力，Ug表示声门气流流速，ρ为空气密度，a1为声门面积；因此声门上压力P1以及声门气流流速Ug为：其中， 4.根据权利要求1所述的一种基于声带特征参数的语音识别分类方法，其特征在于，步骤(3)中，利用全极点模型法DAP表征声道滤波器，嗓音信号中的声门波提取过程如下：将嗓音信号首先通过高通滤波器消除收音设备产生的低频扰动，然后设计DAP滤波器估算声道和口唇辐射的特征，并对嗓音信号进行逆滤波操作消除声道和口腔影响，最后经过连续两次迭代逆滤波操作后，对信号积分得到声门波，其中m＝n＝fs/1000+2。 5.根据权利要求1所述的一种基于声带特征参数的语音识别分类方法，其特征在于，步骤(3)中，根据目标嗓音源逆滤波获得的声门波Uge和声带生物力学模型仿真获得声门波Ugs，提取声门波特征参数基频F0、开商OQ、闭合商CIQ、斜比率Sr和归一化振幅商NAQ并建立目标函数，将两者之间的时域误差定义为目标函数F1：频域误差定义为目标函数F2：式中，N表示Uge和Ugs点数，wge和wgs分别表示Uge和Ugs的频率，将两个目标函数线性加权和为： f＝ω1F1+ω2F2 (7) 式中，ω1和ω2为权重系数。 6.根据权利要求1所述的一种基于声带特征参数的语音识别分类方法，其特征在于，步骤(4)具体如下： 4.1、设置声带质量、弹性系数、耦合系数、阻尼常数及声门下压力为可优化参数，表示为矢量：Φ＝”miα,kiα,kcα,riα,Ps”； 4.2、采用变异粒子群法求得优化解； 4.3、最后利用拟牛顿算法对满足终止条件的优化解进行局部优化，找到全局最优解，得到实际嗓音声源发声时的声带特征参数包括声带质量、弹性系数、耦合系数、阻尼常数、声门下压力和声门波特征，作为语音识别的声带特征参数。 7.根据权利要求6所述的一种基于声带特征参数的语音识别分类方法，其特征在于，步骤4.2所述采用变异粒子群法求得优化解具体如下：首先，初始化一群随机粒子，粒子速度以及迭代次数；然后，更新粒子的位置速度，计算粒子群中每个个体的适应度值：如果所得最高适应度超过预先设置的阈值或达到预先设置的迭代次数，则作为优化个体；否则选择M个个体交叉、变异，得到M个新个体，选择和交叉过程中采用轮盘赌规则；之后，对所有M+N个体执行变异操作，选择M个适应度高的进入下一代；重复上述操作。

专利专题