10.16208/j.issn1000-7024.2023.01.019
基于多特征后期融合的声学场景分类
为提高声学场景分类准确率,综合考虑声学事件本身特征对于场景表征的影响以及单模型训练存在的分类误差问题,提出一种基于多特征后期融合的声学场景分类方法.在线性预测倒谱系数的基础上提出声学事件状态似然,结合深度散射谱以及谱质心幅度倒谱系数共同作为特征输入,在残差网络分类器进行并行训练;在分类结果处理阶段,采用平均叠加的整体策略在随机森林上进行集成训练,预测声学场景类别.研究结果表明,所提方法能够有效利用功能互补声学特征对声学场景进行分类,提高分类精度以及泛化性能.
声学场景分类、声学事件、深度学习、残差网络、集成学习、随机森林、特征后期融合
44
TP391(计算技术、计算机技术)
山西省重点研发计划高新技术领域基金项目;山西省回国留学人员科研基金项目
2023-02-10(万方平台首次上网日期,不代表论文的发表时间)
共7页
141-147