DOI：10.3979/j.issn.1673-825X.202012180412

语音识别中的DenseNet模型研究

全文直达

下载全文

在线阅读

引用

摘要：

为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks,DenseNet)模型.根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量.实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率.

关键词：语音识别、非对称卷积、训练效率、卷积神经网络

所属期刊栏目：34

分类号：TP391;TB5(计算技术、计算机技术)

资助基金：重庆市长寿区科技计划项目CS2020007

在线出版日期：2022-09-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：604-611

英文信息展示

期刊专题