基于双向椭圆局部二值模式的环境声音分类
针对目前机器学习算法在环境声音分类准确率不高,训练速度慢的问题,提出了基于双向椭圆局部二值模式的环境声音分类方法.设计了双向椭圆局部二进制模式的音频信号特征提取方法,采用 3×5 信号邻域增加时长影响,并使用邻域左右两列整体平均值分别代替椭圆左右顶点像素,减少噪音干扰,提高对噪音的鲁棒性,使用整个邻域的平均值代替中心像素,并采用双向局部特征均衡顺序权重,在上述特征基础上增加 VAR算子,反应局部特征差异强度,之后将这些特征与梅尔频率倒谱系数(MFCC)、伽玛频率倒谱系数(GFCC)和色度特征(Chromagram)融合.采用经典机器学习算法,如支持向量机(SVM)、随机森林(RF)和k 近邻(kNN),结合融合特征,在 ESC-10 和 ESC-50 数据集上进行评估,两种数据集的分类准确度分别达到了 90.9%和 66.7%.
环境声音分类、局部二进制模式、特征融合
42
TP23(自动化技术及设备)
国基自然科学基金项目;湖北省省级教研项目
2023-09-15(万方平台首次上网日期,不代表论文的发表时间)
共8页
63-70