10.3979/j.issn.1673-825X.202012180412
语音识别中的DenseNet模型研究
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks,DenseNet)模型.根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量.实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率.
语音识别、非对称卷积、训练效率、卷积神经网络
34
TP391;TB5(计算技术、计算机技术)
重庆市长寿区科技计划项目CS2020007
2022-09-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
604-611