10.3969/j.issn.1004-9037.2001.01.013
一种基于共振峰恢复和 Mellin 变换的 非特定人语音特征提取方法
针对非特定人语音识别中的声道长度归一化问题,首先研究了一种能够去掉基音激励的、 基于自相关估计的共振峰 (Formant)频谱恢复方法,说明了不同说话人发同一元音时的频谱互为 尺度化的关系,以及它们与同一说话人发不同元音时频谱的差别,然后结合具有尺度不变性的 Mellin 变换,提出了一种适用于非特定人的语音特征提取方法。在实验中,对从非特定人收集的20 个汉语元音,分别提取了其FFT倒谱、Mel倒谱 FFT-Mellin 倒谱及本文 Formant-Mellin 倒谱, 并用一种很直观的 F-ratio 分辨率准则进行了性能评价。结果表明,无论是对纯净的,还是对带附 加白噪声的发音样本,本文由共振峰恢复和Mellin 变换相结合得到的语音特征都具有较高的分辨率。
Mellin变换、自相关估计、F-ratio分辨率、共振峰恢复
16
TN912.3
航空基础科学基金
2004-01-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
58-62