基于瓶颈特征的藏语拉萨话连续语音识别研究
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点, 将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中, 可以代替传统的MFCC特征进行GMM-HMM声学建模.在藏语拉萨话连续语音识别任务中的实验表明, 瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现.
藏语拉萨话、连续语音识别、高斯混合—隐马尔科夫模型、瓶颈特征、深度神经网络
54
TP391(计算技术、计算机技术)
教育部人文社会科学规划基金15YJAZH120;中央民族大学双一流学科建设项目资助
2018-05-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
249-254