DOI：10.11992/tis.201710029

基于深度神经网络的蒙古语声学模型建模研究

引用

摘要：

针对高斯混合模型在蒙古语语音识别声学建模中不能充分描述蒙古语声学特征之间相关性和独立性假设的问题,开展了使用深度神经网络模型进行蒙古语声学模型建模的研究.以深度神经网络为基础,将分类与语音特征内在结构的学习紧密结合进行蒙古语声学特征的提取,构建了DNN-HMM蒙古语声学模型,结合无监督预训练与监督训练调优过程设计了训练算法,在DNN-HMM蒙古语声学模型训练中加入dropout技术避免过拟合现象.最后,在小规模语料库和Kaldi实验平台下,对GMM-HMM和DNN-HMM蒙古语声学模型进行了对比实验.实验结果表明,DNN-HMM蒙古语声学模型的词识别错误率降低了7.5％,句识别错误率降低了13.63％;同时,训练时加入dro-pout技术可以有效避免DNN-HMM蒙古语声学模型的过拟合现象.

关键词：语音识别、声学模型、GMM-HMM、DNN-HMM、监督学习、预训练、过拟合、dropout

所属期刊栏目：13

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61762070,61650205

在线出版日期：2018-06-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：486-492

英文信息展示

期刊专题