10.16208/j.issn1000-7024.2023.03.033
基于双路卷积神经网络的中文语音识别
为解决卷积神经网络在中文语音识别中识别准确率低、鲁棒性差的问题,提出一种基于双路卷积神经网络的声学建模方法.利用多尺度学习方法提取多尺度特征信息;将软阈值非线性转换层和注意力机制进行融合后嵌入残差网络,减轻网络梯度问题,加强网络特征信息传递,提高特征学习效果;采用连接时序分类技术分类,简化语音识别流程.实验结果表明,该模型与传统识别模型相比,词错误率降低了7.52%,在3种噪声环境下,错误率也低于传统模型.
语音识别、多尺度学习、软阈值、注意力机制、残差网络、连接时序分类、端到端
44
TN912.34
山西省自然科学基金;山西省回国留学科研基金项目
2023-05-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
880-886