基于CNN-TDNN-F的低资源语音识别研究
为了解决语音识别系统在低资源语料下识别性能低下的问题,提出了一种采用因子分解时延神经网络的低资源语音识别方案,并从数据扩展和模型优化两个方面展开.在数据扩展方面提出了一种以语谱图增强、语音合成以及半监督学习为主的数据增强方案.在模型优化方面,在因子分解时延神经网络基础上,引入卷积神经网络.实验结果表明,在低资源语料环境下,与传统低资源语音识别解决方案相比,本方案对语音识别系统性能的提升具有更好的效果.
时延神经网络、半监督学习、语音合成、语音识别、数据增强
16
TP18(自动化基础理论)
国家自然科学基金项目;陕西省教育厅专项基金项目
2020-12-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
1-4