10.11896/j.issn.1002-137X.2017.010.057
资源稀缺蒙语语音识别研究
随着语音识别技术的发展,资源稀缺语言的语音识别系统的研究吸引了更广泛的关注.以蒙语为目标识别语言,研究了在资源稀缺的情况下(如仅有10小时的带标注的语音)如何利用其他多语言信息提高识别系统的性能.借助基于多语言深度神经网络的跨语言迁移学习和基于多语言深度Bottleneck神经网络的抽取特征可以获得更具有区分度的声学模型.通过搜索引擎以及网络爬虫的定向抓取获得大量的网页数据,有助于获得文本数据,以增强语言模型的性能.融合多个不同识别结果以进一步提高识别精度.与基线系统相比,多种系统融合的识别绝对错误率减少12%.
资源稀缺、多语言深度神经网络、Web语言模型
44
TP391.42(计算技术、计算机技术)
国家自然科学基金61305027;山东省自然科学基金ZR2011FQ024;山东省高等学校科技计划J17KB160
2017-11-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
318-322