DOI：10.3969/j.issn.1000-3428.2018.01.034

基于Kaldi的普米语语音识别

引用

摘要：

为提高普米语语音识别系统的性能,引入深度学习模型进行普米语语音识别,该模型是一个高容量复杂的网络模型.以Kaldi语音识别工具包为实验平台,分别训练5种不同的声学模型,且这5种模型中包含一个有4隐层的深度神经网络模型.比较不同声学模型得到的语音识别率发现,G-DNN模型比Monophone模型的语音识别率平均提升49.8％.实验结果表明,当增加训练集的普米语语音语料量时,基于深度学习的普米语语音识别率会提升,而基于深度学习的普米语语音识别系统的鲁棒性比其余4个声学模型的普米语语音识别系统的鲁棒性更强.

关键词：普米语、深度学习、Kaldi语音识别工具包、语音识别、鲁棒性

所属期刊栏目：44

分类号：TP18(自动化基础理论)

资助基金：国家科技支撑计划项目2013BAJ07B02-1;云南省教育厅科学研究基金2016YJS078;云南省高校物联网应用技术重点实验室开放研究课题2015IOT02

在线出版日期：2018-04-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：199-205

英文信息展示

期刊专题