10.19678/j.issn.1000-3428.0056278
基于瓶颈复合特征的声学模型建立方法
针对梅尔频率倒谱系数(MFCC)语音特征不能有效反映连续帧之间有效信息的问题,基于深度神经网络相关性和紧凑性特征,提出一种融合神经网瓶颈特征与MFCC特征的复合特征构造方法,提高语音的表征能力和建模能力.从语音数据中提取MFCC特征作为输入数据,将MFCC特征和BN特征进行串接得到新的复合特征,并进行GMM-HMM声学建模.在TIMIT数据库上的实验结果表明,与单一的瓶颈特征和深度神经网络后验特征相比,该方法识别率明显提升.
深度神经网络、梅尔频率倒谱系数、瓶颈特征、复合特征、高斯混合模型-隐马尔科夫模型
46
TP391(计算技术、计算机技术)
国际科技合作项目一般项目"基于大数据信息决策的智慧农业自动灌溉系统研究"2018KW-025
2021-01-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
301-305,314