基于对数Gammatone滤波器能量谱图的语种识别
针对语种识别在噪声环境下识别率低的问题,提出了一种基于对数Gammatone滤波器能量特征谱图的语种识别方法.依据Gammatone滤波器组的听觉特征提取出对数Gammatone滤波器能量特征,并将特征转化为图像获得特征谱图,然后运用暗通道先验算法对特征图进行增强去噪,最后使用残差神经网络模型进行训练识别.实验表明,在信噪比为0 dB,噪声源分别为白噪声、车内噪声和粉红噪声时,该方法相对于线性灰度语谱图识别率分别提升了32.7%、10.1%和29.1%,且在其他信噪比下的识别率也有一定的提升.
语种识别、听觉特征、Gammatone滤波器、残差神经网络
46
TN912.3
国家自然科学基金61761025
2023-03-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
38-43