DOI：10.16208/j.issn1000-7024.2020.09.037

基于门控卷积网络与CTC的端到端语音识别

引用

摘要：

针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型.通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门控线性单元减少梯度弥散,利用CTC算法实现以汉字字符作为建模基元的端到端训练和解码.在公开数据集上的实验结果表明,与基线模型相比,该模型语音识别性能有明显提升,字错误率降低了3.3％以上.

关键词：语音识别、端到端、卷积神经网络、门控线性单元、链接时序分类

所属期刊栏目：41

分类号：TP391.42(计算技术、计算机技术)

在线出版日期：2020-10-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：2650-2654

英文信息展示

期刊专题