DOI：10.13705/j.issn.1671-6833.2018.02.004

基于改进的LSTM深度神经网络语音识别研究

引用

摘要：

当前基于LSTM结构的神经网络语言模型中,在隐藏层引入了LSTM结构单元,这种结构单元包含一个信息储存较久的存储单元,对历史信息有良好的记忆功能.但LSTM中当前输入信息的状态不能影响到输出门最后的输出信息,对历史信息的获取较少.针对以上问题,笔者提出了基于改进的LSTM(long short-term memory)网络模型建模方法,该模型增加从当前输入门到输出门的连接,同时将遗忘门和输入门合成一个单一的更新门.信息通过输入门和遗忘门将过去与现在的记忆进行合并,可以选择遗忘之前累积的信息,使得改进的LSTM模型可以学到长时期的历史信息,解决了标准LSTM方法的缺点,具有更强的鲁棒性.采用基于改进的LSTM结构的神经网络语言模型,在TIMIT数据集上进行模型测试,结果表明,改进的LSTM识别错误率较标准的LSTM识别错误率降低了5％.

关键词：长短时记忆(LSTM)、深度神经网络、语音识别

所属期刊栏目：39

分类号：TP39(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61202163;“十二五”山西省科技重大专项资助项目20121101001;山西省教研项目J2017078

在线出版日期：2018-11-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：63-67

英文信息展示

期刊专题