基于三层结构优化卷积神经网络的语音识别
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13880/j.cnki.65-1174/n.2021.21.049

基于三层结构优化卷积神经网络的语音识别

引用
目前说话人、环境及发音多样性仍是语音识别声学建模中需解决的主要难题,为了克服这些不利因素的影响,本文将经过三层结构优化后的卷积神经网络应用于语音识别,利用卷积神经网络的卷积不变性克服语音信号的多样性,采用更符合生物神经元特性的新型激活函数改进卷积层缓解梯度消失的问题;利用中间池化方法改进池化层、减小特征提取误差,使用卷积层代替全连接层的方式降低模型复杂度,再通过与对比方法进行多种指标评价,结果表明:本文提出的方法较对比算法在中文语音、英文语音两种数据集下平均识别错误率分别下降22.05%和20.27%.比传统卷积神经网络模型的损失值相对减小40%,在一定程度上提升了模型的泛化能力.

声学建模、三层结构优化、卷积神经网络、语音识别、识别率、泛化性能

40

TN912.3

国家自然科学基金;陕西省科技计划

2022-04-11(万方平台首次上网日期,不代表论文的发表时间)

共6页

127-132

相关文献
评论
暂无封面信息
查看本期封面目录

石河子大学学报(自然科学版)

1007-7383

65-1174/N

40

2022,40(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn