10.11684/j.issn.1000-310X.2020.03.020
基于双向循环神经网络的汉语语音识别
当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用.针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别.构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构.实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势.
语音识别、深度学习、深度神经网络、循环神经网络
39
TN912.3
湖北省教育厅科学研究计划资助项目;长江大学大学生创新创业基金项目;地理国情监测国家测绘地理信息局重点实验室开发基金项目
2020-05-28(万方平台首次上网日期,不代表论文的发表时间)
共8页
464-471