基于卷积神经网络的鲁棒性基音检测方法
在语音信号中,基音是一个重要参数,且有重要用途。然而,检测噪声环境中语音的基音却是一项难度较大的工作。由于卷积神经网络(Convolutional neural network, CNN)具有平移不变性,能够很好地刻画语谱图中的谐波结构,因此我们提出使用CNN 来完成这项工作。具体地,我们使用CNN来选取候选基音,再用动态规划方法(Dynamic programming, DP)进行基音追踪,生成连续的基音轮廓。实验表明,与其他方法相比,本文的方法具有明显的性能优势,并且对新的说话人和噪声有很好的泛化性能,具有更好的鲁棒性。
信号处理、基音检测、卷积神经网络、动态规划
42
TP1;TP3
国家自然科学基金61365006,61263037资助Supported by National Natural Science Foundation of China 61365006,61263037
2016-07-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
959-964