10.3969/j.issn.1006-2475.2021.02.012
基于特征融合和改进卷积神经网络的环境音识别
由于环境声音复杂的结构,环境声音识别是一个具有挑战性的问题.本文提出一种将特征融合与改进卷积神经网络算法相结合的环境音识别方法.首先针对原始音频文件,提取从波形中学习到的特征以及传统音频特征,分别为MF-CC(梅尔倒谱系数)、GFCC(伽玛通频率倒谱系数)、频谱对比度和CQT(恒定Q变换);然后将提取到的特征分别输入到端到端的神经网络SF-CNN和多尺度卷积神经网络MS-CNN中进行识别;最后根据D-S证据理论决策规则进行决策级融合,输出最终识别结果.通过在公开数据集ESC-50进行的实验结果表明,本文提出的模型能够提高识别准确率,且优于单特征模型,更适用于复杂的声学场景.
环境声音识别、特征融合、多尺度卷积运算、D-S证据理论
TP183(自动化基础理论)
江苏省自然科学基金资助项目BK20151500
2021-05-08(万方平台首次上网日期,不代表论文的发表时间)
共6页
62-67