基于声音识别无人机的方法及系统

引用

摘要：

本发明提供了一种基于声音识别无人机的方法、系统电子设备及计算机可读存储介质，其中的方法包括：采集待识别的声音信号；音对采集的声音信号进行滤波，增强信号质量；然后进行预加重、分帧、加窗处理；提取声音信号的音频特征，构成无人机声音样本库；通过无人机识别声学模型对声音信号进行识别；最后运用麦克风阵列接收无人机目标声音信号，然后进行数字信号处理，最终得到声源的位置信息，为反无人机下一步操作做准备。本发明利用IRBNet模型作为声学模型，通过卷积神经网络对无人机声音样本库样本训练改声学模型，以实现对无人机的有效识别。

专利类型：发明专利

申请/专利号：CN202011375154.0

申请日期：2020-11-30

公开/公告号：CN112735473A

公开/公告日：2021-04-30

主分类号：G10L25/51(2013.01)

申请/专利权人:长春理工大学

发明/设计人:薛珊;卫立炜;吕琼莹;陈宇超

主申请人地址:130022 吉林省长春市朝阳区卫星路7089号

专利代理机构:北京鸿元知识产权代理有限公司

代理人:袁文婷%张娓娓

国别省市代码:吉林;22

权利要求：

1.一种基于声音识别无人机的方法，应用于电子装置，其特征在于，包括：采集待识别的声音信号；对所述声音信号进行滤波和预处理，以提取所述声音信号的音频特征；根据预设的声学模型对所述音频特征进行识别，确定是否存在无人机，以及存在的无人机的所属型号；其中，所述声学模型为运用卷积神经网络对无人机声音样本库样本进行训练学习所得到的用于无人机声音识别的声学模型，所述声学模型为IRBNet模型，所述IRBNet模型包括IRTBlock-A模块和IRTBlock-B模块；其中，所述IRTBlock-A模块的主通路在进行残差相加融合之前只利用1×1卷积进行升维，并且在残差相加融合之后再进行降维；所述IRTBlock-A模块的主通路包括并行主通路和远跳链接主通路；其中，所述并行主通路为1×1Conv+BN+Relu+3×3Conv+BN+Relu+3×3Conv+BN；所述远跳连接通路为1×1Conv+BN+Relu，通过1x1的卷积核来调整大小，使得维度相等；所述IRTBlock-B模块用于利用非对称卷积来代替所述IRTBlock-A中的3×3对称卷积。 2.如权利要求1所述的基于声音识别无人机的方法，其特征在于，所述并行主通路和远跳链接主通路的输出结果在融合层进行残差相加融合后，进入IRes-Model和Trans-Model；其中，在所述IRes-Model中，将融合层的结果输入Relu激活函数；所述Trans-Model，用于连接各个IRes-Model，以及运用Pooling层进行特征降维；其中，在所述Trans-Model中，将融合层的结果在输入汇聚层前利用1×1卷积进行特征降维。 3.如权利要求2所述的基于声音识别无人机的方法，其特征在于，在所述IRes-Model中，各通路所有卷积层的步长均为1，过滤器数目均相同，并且使用SAME填充。 4.如权利要求1所述的基于声音识别无人机的方法，其特征在于，在对所述声音信号进行滤波和预处理，以提取所述声音信号的音频特征的过程中，通过滤波模块对所述声音信号进行滤波处理，以增强所述声音信号的信号质量；通过预处理模块对滤波后的声音信号进行预加重、分帧、加窗处理，以把所述声音信号预处理为以段为单位的音频样本；通过特征提取模块对所述音频样本进行音频特征的提取。 5.如权利要求4所述的基于声音识别无人机的方法，其特征在于，所述特征提取模块对所述音频样本依次通过分帧、加窗、傅里叶变换、梅尔滤波、Log对数能量处理，得到最终的Log-Mel特征作为所述音频样本的音频特征。 6.如权利要求1所述的基于声音识别无人机的方法，其特征在于，还包括创建所述声学模型的步骤，其中，创建所述声学模型的步骤包括：通过采集不同型号、尺寸、姿态、距离、速度以及不同场景中的无人机声音信号获取所述无人机声音样本库的原始声音样本；对所述原始声音样本进行特征处理以获取所述无人机声音样本库；运用卷积神经网络对所述无人机声音样本库样本进行训练学习，得到所述声学模型。 7.如权利要求1所述的基于声音识别无人机的方法，其特征在于，在确定存在无人机之后，还包括基于麦克风阵列判断目标无人机的方向位置的步骤。 8.一种基于声音识别无人机的系统，包括：声音采集单元，用于采集待识别的声音信号；音频特征处理单元，用于对所述声音信号进行滤波和预处理，以提取所述声音信号的音频特征；声音识别单元，用于根据预设的声学模型对所述音频特征进行识别，确定是否存在无人机，以及存在的无人机的所属型号；其中，所述声学模型为运用卷积神经网络对无人机声音样本库样本进行训练学习所得到的用于无人机声音识别的声学模型，所述声学模型为IRBNet模型，所述IRBNet模型包括IRTBlock-A模块和IRTBlock-B模块；其中，所述IRTBlock-A模块的主通路在进行残差相加融合之前只利用1×1卷积进行升维，并且在残差相加融合之后再进行降维；所述IRTBlock-A模块的主通路包括并行主通路和远跳链接主通路；其中，所述并行主通路为1×1Conv+BN+Relu+3×3Conv+BN+Relu+3×3Conv+BN；所述远跳连接通路为1×1Conv+BN+Relu，通过1x1的卷积核来调整大小，使得维度相等；所述IRTBlock-B模块用于利用非对称卷积来代替所述IRTBlock-A中的3×3对称卷积。 9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至7中任一所述的基于声音识别无人机的方法中的步骤。 10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的基于声音识别无人机的方法。

专利专题