DOI：10.11772/j.issn.1001-9081.2020020272

基于听皮层神经元感受野的强噪声环境下说话人识别

引用

摘要：

针对说话人识别易受环境噪声影响的问题,借鉴生物听皮层神经元频谱?时间感受野(STRF)的时空滤波机制,提出一种新的声纹特征提取方法.在该方法中,对基于STRF获得的听觉尺度?速率图进行了二次特征提取,并与传统梅尔倒谱系数(MFCC)进行组合,获得了对环境噪声具有强容忍的声纹特征.采用支持向量机(SVM)作为分类器,对不同信噪比(SNR)语音数据进行测试的结果表明,基于STRF的特征对噪声的鲁棒性普遍高于MFCC系数,但识别正确率较低;组合特征提升了语音识别的正确率,同时对环境噪声具有良好的鲁棒性.该结果说明所提方法在强噪声环境下说话人识别上是有效的.

关键词：听皮层、频谱?时间感受野、梅尔倒谱系数、含噪说话人识别、支持向量机

所属期刊栏目：40

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目11804309

在线出版日期：2020-10-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：3034-3040

英文信息展示

期刊专题