基于瓶颈复合特征的声学模型建立方法

引用

摘要：

针对梅尔频率倒谱系数(MFCC)语音特征不能有效反映连续帧之间有效信息的问题,基于深度神经网络相关性和紧凑性特征,提出一种融合神经网瓶颈特征与MFCC特征的复合特征构造方法,提高语音的表征能力和建模能力.从语音数据中提取MFCC特征作为输入数据,将MFCC特征和BN特征进行串接得到新的复合特征,并进行GMM-HMM声学建模.在TIMIT数据库上的实验结果表明,与单一的瓶颈特征和深度神经网络后验特征相比,该方法识别率明显提升.

关键词：深度神经网络、梅尔频率倒谱系数、瓶颈特征、复合特征、高斯混合模型-隐马尔科夫模型

所属期刊栏目：46

分类号：TP391(计算技术、计算机技术)

资助基金：国际科技合作项目一般项目"基于大数据信息决策的智慧农业自动灌溉系统研究"2018KW-025

在线出版日期：2021-01-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：301-305,314

英文信息展示

期刊专题