10.13705/j.issn.1671-6833.2018.02.004
基于改进的LSTM深度神经网络语音识别研究
当前基于LSTM结构的神经网络语言模型中,在隐藏层引入了LSTM结构单元,这种结构单元包含一个信息储存较久的存储单元,对历史信息有良好的记忆功能.但LSTM中当前输入信息的状态不能影响到输出门最后的输出信息,对历史信息的获取较少.针对以上问题,笔者提出了基于改进的LSTM(long short-term memory)网络模型建模方法,该模型增加从当前输入门到输出门的连接,同时将遗忘门和输入门合成一个单一的更新门.信息通过输入门和遗忘门将过去与现在的记忆进行合并,可以选择遗忘之前累积的信息,使得改进的LSTM模型可以学到长时期的历史信息,解决了标准LSTM方法的缺点,具有更强的鲁棒性.采用基于改进的LSTM结构的神经网络语言模型,在TIMIT数据集上进行模型测试,结果表明,改进的LSTM识别错误率较标准的LSTM识别错误率降低了5%.
长短时记忆(LSTM)、深度神经网络、语音识别
39
TP39(计算技术、计算机技术)
国家自然科学基金资助项目61202163;“十二五”山西省科技重大专项资助项目20121101001;山西省教研项目J2017078
2018-11-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
63-67