10.19734/j.issn.1001-3695.2018.11.0867
基于多层次注意力机制一维DenseNet音频事件检测
在音频事件检测任务中,目标音频易受背景噪声等因素的干扰,并且其在音频信号流中存在的比例不高,针对这些问题,提出一种多层次注意力机制一维DenseNet(dense convolutional network)音频事件检测模型.使用一维DenseNet模型进行帧级检测能有效地检测音频事件发生的开始和结束时间;在一维DenseNet模型中引入多层次注意力机制,使得不同模块的感知特性随着网络层数的加深而自适应地变化,因此模型可以在不同的网络层次自动选择和关注重要的目标帧而抑制不相关的背景帧.在DCASE 2017任务2的开发数据集上的实验表明,该方法的整体性能较传统的深度学习方法有进一步提高.
音频事件检测、深度学习、DenseNet、多层次注意力机制
37
TP391.42(计算技术、计算机技术)
湖北省自然科学基金重点类资助项目2017CFA012
2020-06-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
1642-1646