DOI：10.16652/j.issn.1004-373x.2023.02.017

基于线性预测能量谱系数的自然语音和耳语音的分类研究

引用

摘要：

在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能.基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类.此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上.实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好.最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性.实验还发现,女生的耳语音有更好的分类效果.

关键词：语音分类、语音识别、耳语音、线性预测能量谱系数、特征提取、频谱图切分、结果分析、效果验证

所属期刊栏目：46

分类号：TN911.23-34

资助基金：国防科技基础加强计划;国家自然科学基金

在线出版日期：2023-02-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：85-90

英文信息展示

期刊专题