10.16088/j.issn.1001-6600.2022083002
声音事件检测综述
声音事件检测技术能够识别出一个音频段中存在的事件类别并标注出各事件的起止时间,在智能城市、医疗监控、野生动物保护等应用场景有巨大潜力,是机器听觉领域的一个重要研究课题.本文从监督学习和半监督学习2个方面对声音事件检测方法进行综述,汇总和分析现有研究中使用的特征、检测模型及其性能.对于监督学习,重点介绍机器学习方法和深度学习方法.对于半监督学习,总结基于均值教师、协同训练、多尺度卷积和注意力机制等4种有效方法.最后,介绍常用数据集和评价指标,并讨论未来可能的研究方向,包括声音分离预处理、合成数据和真实数据域适应、自注意力模型优化、特征选择和融合、流式系统建模等问题.
声音事件检测、机器学习、深度学习、神经网络、监督学习、半监督学习
41
TN912.3;TP181
国家自然科学基金;天津市自然科学基金
2023-04-28(万方平台首次上网日期,不代表论文的发表时间)
共18页
1-18