DOI：10.11896/j.issn.1002-137X.2017.010.057

资源稀缺蒙语语音识别研究

引用

摘要：

随着语音识别技术的发展,资源稀缺语言的语音识别系统的研究吸引了更广泛的关注.以蒙语为目标识别语言,研究了在资源稀缺的情况下(如仅有10小时的带标注的语音)如何利用其他多语言信息提高识别系统的性能.借助基于多语言深度神经网络的跨语言迁移学习和基于多语言深度Bottleneck神经网络的抽取特征可以获得更具有区分度的声学模型.通过搜索引擎以及网络爬虫的定向抓取获得大量的网页数据,有助于获得文本数据,以增强语言模型的性能.融合多个不同识别结果以进一步提高识别精度.与基线系统相比,多种系统融合的识别绝对错误率减少12％.

关键词：资源稀缺、多语言深度神经网络、Web语言模型

所属期刊栏目：44

分类号：TP391.42(计算技术、计算机技术)

资助基金：国家自然科学基金61305027;山东省自然科学基金ZR2011FQ024;山东省高等学校科技计划J17KB160

在线出版日期：2017-11-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：318-322

英文信息展示

期刊专题