10.16652/j.issn.1004-373x.2023.02.017
基于线性预测能量谱系数的自然语音和耳语音的分类研究
在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能.基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类.此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上.实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好.最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性.实验还发现,女生的耳语音有更好的分类效果.
语音分类、语音识别、耳语音、线性预测能量谱系数、特征提取、频谱图切分、结果分析、效果验证
46
TN911.23-34
国防科技基础加强计划;国家自然科学基金
2023-02-10(万方平台首次上网日期,不代表论文的发表时间)
共6页
85-90