面向真实噪声环境的语种识别
语种识别受真实噪声环境的影响较大,识别效果不佳.为了解决真实噪声环境下语种识别的问题,提出一种基于对数灰度语谱图的图像处理语种识别方法.根据噪声能量和语音能量在语谱图上的分布规律对真实噪声中的语音信号进行带通滤波;再结合人耳听觉特性提取对数灰度语谱图;然后提取图像主成分特征作为语种特征,采用残差神经网络模型进行训练测试.实验结果表明,在掠夺者战斗机驾驶舱的环境下,所提方法的平均识别正确率相对于线性灰度语谱图方法提升了27.5%,在其他噪声环境下的平均识别正确率也有提升.
语种识别;真实噪声环境;对数灰度语谱图;残差神经网络;图像处理
44
TN912.3
国家自然科学基金61761025
2022-01-14(万方平台首次上网日期,不代表论文的发表时间)
共7页
134-140