10.3969/j.issn.1000-310X.2001.06.002
基于听觉模型的话者特征参数提取及其在噪声背景下的话者辨识
本文基于人耳听觉模型提出了一种鲁棒性的话者特征参数提取方法.该种方法中,首先由Gammatone听觉滤波器组和Meddis内耳毛细胞发放模型获得表征听觉神经活动特性的听觉相关图.由听觉神经脉冲发放的锁相特性和双声抑制特性,我们将听觉相关图每个频带中的幅值最大频率分量作为表征当前频带特性的特征参量,于是所有频带的特征参量便构成了表征当前语音段特性的特征矢量;我们采用DCT变换进一步消除各个特征参量之间的相关性,压缩特征矢量的维数.有效性试验表明,该种特征矢量基本上反映了输入语音的谱包络特性;抗噪声性能实验表明,在高斯白噪声和汽车噪声干扰下,该种特征参数比LPCC和MFCC有较小的相对失真;基于矢量量化的文本无关话者辨识表明,对于三种类型的噪声干扰该种特征参数在低信噪比下都获得了较好的识别结果.
听觉模型、文本无关话者辨识、抗噪声鲁棒性
20
TB5(声学工程)
国家自然科学基金69872014
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
6-12,44