DOI：10.11772/j.issn.1001-9081.2020030433

基于轻量级深度神经网络的环境声音识别

引用

摘要：

针对传统卷积神经网络(CNN)模型存在大量冗余参数的问题,提出了两个基于SqueezeNet核心结构Fire模块的轻量级网络模型Fnet1和Fnet2.之后结合移动端分布式数据采集和处理的特点,在Fnet2模型基础上,依据Dempster-Shafer(D-S)证据理论将Fnet2与深度神经网络(DNN)融合,提出新的网络模型FnetDNN.首先,建立一个具有四层卷积层的神经网络Cent作为基准,以梅尔倒谱系数(MFCC)作为特征输入来对比分析Fnet1、Fnet2和Cent的网络结构特点、计算量、卷积核参数数量及识别准确率,结论是Fnet1仅使用Cnet参数数量的10.3％就可达到86.7％的分类准确率;然后,将MFCC与全局特征向量输入到FnetDNN模型中,使得该模型的识别准确率提高到了94.4％.实验结果表明,Fnet网络模型不仅可以压缩冗余参数,还可以与其他网络相融合,具备模型扩展能力.

关键词：环境声音识别、深度神经网络、D-S证据理论、梅尔倒谱系数

所属期刊栏目：40

分类号：TP183(自动化基础理论)

资助基金：光电信息控制和安全技术重点实验室基金资助项目614210701041705

在线出版日期：2020-11-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：3172-3177

英文信息展示

期刊专题