基于CNN-TDNN-F的低资源语音识别研究

引用

摘要：

为了解决语音识别系统在低资源语料下识别性能低下的问题,提出了一种采用因子分解时延神经网络的低资源语音识别方案,并从数据扩展和模型优化两个方面展开.在数据扩展方面提出了一种以语谱图增强、语音合成以及半监督学习为主的数据增强方案.在模型优化方面,在因子分解时延神经网络基础上,引入卷积神经网络.实验结果表明,在低资源语料环境下,与传统低资源语音识别解决方案相比,本方案对语音识别系统性能的提升具有更好的效果.

关键词：时延神经网络、半监督学习、语音合成、语音识别、数据增强

所属期刊栏目：16

分类号：TP18(自动化基础理论)

资助基金：国家自然科学基金项目;陕西省教育厅专项基金项目

在线出版日期：2020-12-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：1-4

英文信息展示

期刊专题