10.16798/j.issn.1003-0530.2021.10.014
基于改进池化层的弱标记声音事件检测
针对DCASE2017挑战赛任务4提供的大规模弱标记声音事件检测数据集,我们搭建了基于梅尔滤波器特征(Fbank)、卷积神经网络(CNN)以及循环神经网络(RNN)的多类别声音事件检测系统,分析了 attention和lin-ear softmax两种已有的常用池化层在神经网络反向传播中的部分推演过程,并在linear softmax池化层的基础上进行改进,提出了一种"指数可学习的幂函数softmax"池化层.实验结果表明,相比于DCASE竞赛中获得第一名的模型,应用"指数可学习的幂函数softmax"池化层的检测系统,将段级别的声音事件预测的F1值从0.556提高到0.652,帧级别预测的F1值从0.518提高到0.583,帧级别预测的error rate(ER)从0.730降低到0.667.
弱标记;声音事件检测;池化层;指数可学习的幂函数softmax
37
TP37(计算技术、计算机技术)
2021-12-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
1907-1913