基于量化误差熵的多层随机神经网络的城市噪音识别方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

基于量化误差熵的多层随机神经网络的城市噪音识别方法

引用
本发明公开了一种基于量化误差熵的多层随机神经网络的城市噪音识别方法。本发明步骤:1.对采集到的声音信号进行处理,然后进行特征提取,建立声音数据库。2.将最小量化误差熵引入到多层随机神经网络的编码器中,作为编码器输出权重的训练准则,学习数据中的特征。3.确定多层随机神经网络的网络结构和参数,将建立的声音数据库中的数据作为多层随神经网络的训练数据。4.引入非高斯噪声模型。5.生成非高斯噪声数据,加入到原始数据中,然后放入模型中进行训练。本发明采用了算法简单、无需反向迭代、计算速度快,泛化能力强的随机神经网络框架,并在模型的编码层加入QMEE算法作为编码层的训练准则,提高了噪音识别更准确。

发明专利

CN202010824747.4

2020-08-17

CN112086100A

2020-12-15

G10L17/26(2013.01)

杭州电子科技大学

曹九稳;马荣志

310018 浙江省杭州市下沙高教园区2号大街

杭州君度专利代理事务所(特殊普通合伙)

朱月芬

浙江;33

1.基于量化误差熵的多层随机神经网络的城市噪音识别方法,其特征在于包括如下步骤: 步骤一.对采集到的声音信号进行处理,然后进行特征提取,建立声音数据库; 步骤二.将最小量化误差熵引入到多层随机神经网络的编码器中,作为输出权重的训练准则,学习数据中的特征; 步骤三.确定多层随机神经网络的网络结构和参数,将建立的声音数据库中的数据作为多层随神经网络的训练数据; 步骤四.引入非高斯噪声模型模拟城市环境的复杂性; 步骤五.生成非高斯噪声数据,加入到原始数据中,然后放入多层随机神经网络中进行训练。 2.根据权利要求1所述的基于量化误差熵的多层随机神经网络的城市噪音识别方法,其特征在于所述步骤一的具体流程如下: 1-1.采集城市里工程机械设备作业环境中的声音信号,并建立同类型的声音数据库,一共采集了11种类型的声音数据,分别是挖掘机、电锤、切割机、引擎、警报、液压锤、铣床、发电机,歌声,人声,风噪声; 1-2.对声音数据库所有声音数据进行预加重,预加重处理就是将声音信号通过一个高通滤波器:H(z)=1-μz-1,其中μ的取值范围为0.9~1.0; 1-3.对处理后的声音数据进行分频处理,帧长取10~30ms; 1-4.将每一帧数据乘以汉明窗,以增加帧左端和右端的连续性;假设分帧后的信号为S(n),n=0,1,2,...,N*-1,其中N*为帧的大小,进行汉明窗处理可表示为S′(n)=S(n)×W(n),S′(n)为经过汉明窗处理后的声音数据,W(n)采用下面的函数: 不同的a值会产生不同的汉明窗,a取值为0.46; 1-5.对经过汉明窗处理的每一帧声音数据进行快速傅里叶变换,将时域数据转为频域数据;变换公式如下: 1-6.对每一帧FFT后的声音数据计算谱线的能量 E(k)=”S(k)”2 (3) 1-7.把求出的每帧谱线能量谱通过Mel滤波器,并计算在Mel滤波器中的输出对数能量s(m); 三角滤波器的频率响应定义为: 且满足f(m)为定义的三角滤波器的中心频率,其中0≤m≤M*,M*为滤波器的个数,各个中心频率f(m)之间的间隔随着m值得增大而增宽; 1-7.将每个滤波器组的输出对数能量s(m),经过离散余弦变化得到MFCC系数C(n*); L为MFCC倒谱系数的个数,基于MFCC计算倒谱系数,即所求的声音特征,对不同机械的声音特征进行标号,建立声音数据特征库。 3.根据权利要求1或2所述的基于量化误差熵的多层随机神经网络的城市噪音识别方法,其特征在于所述步骤二的具体流程如下: 2-1.误差熵的定义为:采用α=2的二阶误差熵作为训练准则; V2(e)称为二阶信息潜能,fe(ξ)为误差的概率密度函数,ξ为随机误差变量; 2-2.通过估计方法对概率密度函数进行估计; 2-3.在误差熵和量化误差熵采用的都是核函数σ为方差;通过过Parzen窗方法评估后得到 2-4.设线性系统f(z)=wTz,w为线性模型的权重,z为输入数据,数据的大小为N,其误差为ei=ui-wTzi,zi为第i个输入,ui为第i个期望输出;希望误差的尽可能的小,即尽可能的小,又因为log为单调增函数,所以只需要让最大化即可;用梯度上升的方法实现这一目标; 其中wn为第n次迭代的权重值,η为学习率; 2-5.在误差熵的计算过程中要计算误差对ei和ej,采用量化误差熵作为训练准则; 2-6.误差的量化过程: a)误差样本e=”e1,e2,...,en”,设定量化阈值ε; b)初始化:量化码表C;初始化码表C1=”e1”,其中C1代表第一次迭代后的码表; c)进行循环i=2,...,n d)计算ei和Ci-1之间的距离dist(ei,Ci-1)=|ei-Ci-1(j*)|,其中j*=arg min|ei-Ci-1(j)|代表Ci-1中的第j个元素,|Ci-1|代表Ci-1中的元素个数; e)如果dist(ei,Ci-1)<ε,则保持码表不变,即Ci=Ci-1,将ei量化到最近一次循环得到的码表中,Q”ei”=Ci-1(j*);否则,更新码表Ci=”Ci-1,ei”,并将ei量化为自身Q”ei”=ei; f)跳转到步骤c),直到i>n则停止; 2-7.量化后的信息潜能: 其中M为量化后的误差维度,Mm为量化到cm的误差样本数量,cm为码表C中的第m个元素,其满足 2-8.对进行求导 其中 2-9.令则可以得 2-10.设定梯度上升的迭代次数,实验证明通常30~100次迭代即可得到最优权重。 4.根据权利要求3所述的基于量化误差熵的多层随机神经网络的城市噪音识别方法,其特征在于所述步骤三的具体流程如下: 3-1.给出一个训练集其中xi的维度为d1,ti的维度为d2,为训练样本的个数,自动编码器隐藏层个数L1,分类层隐藏层节点个数L2,在整个多层随机神经网络中激活函数g(x)=1/(1+ex),以保证多层随机神经网络的非线性映射能力; 3-2.初始化编码层的输入权重w1i、偏置b1i和输出权重β0,分类层的输入权重w2i和偏置b2i,计算出编码层中隐藏层的输出h(w1i,xi,b1i)=g(w1ixi+b1i),其编码层的输出权重通过量化误差熵的方法进行计算,其初始误差e=x-h(w,x,b)β0; 3-3.对误差e按步骤2-6的方法进行量化; 3-4.通过n次迭代,得到最优的输出权重βn 其中1<iC≤n,iC代表第iC次迭代;,实验证明通常30~100次迭代即可得到最优权重; 3-5.计算编码层的输出Y1 Y1=g(βnx) (16) 3-6.计算本发明中多层随机神经网络的分类层输出权重 为Y1的伪逆矩阵,x和t对应,为训练集中的样本; 3-7.计算网络的输出并识别出城市噪音数据的种类,得到其分类精度。 5.根据权利要求4所述的基于量化误差熵的多层随机神经网络的城市噪音识别方法,其特征在于所述步骤四的具体流程如下: 4-1.特征提取过后得到的数据中加入非高斯噪声; 4-2.采用了α稳态分布作为非高斯噪声信号模型; 4-3.α稳定分布的概率密度函数并没有统一的闭合形式,若一个随机变量X服从α稳态分布,可以用以下函数描述: φ(t)=exp”jδt-γ|t|α”1+jβsgn(t)ω(t,a)”” (18) 其中-∞<δ<+∞,γ>0,0<α≤2,-1≤β≤1;δ表示位置参数,γ代表尺度参数,β为偏斜因子,sgn(t)是符号函数,ω(t,a)代表关于t和α的函数,α表示特征值数,表征α稳定分布概率密度函数拖尾的厚重程度,当β=0、δ=0、α=2时为高斯分布; 4-4.α稳定分布具有如下特点: a)衰减的速度和α的大小相关,α越小,分布的拖尾越严重; b)当α≤1时,分布具有无限的均值和方差; c)分布可以具有不对称分布,β为偏斜因子; d)参数的取值范围:0<α≤2,-1≤β≤1; 6.根据权利要求5所述的基于量化误差熵的多层随机神经网络的城市噪音识别方法,其特征在于所述步骤五的具体流程如下: 5-1.用上面的α稳定分布模型生成α分别等于0.5、0.75、1.0、1.25、1.5,幅值范围为”-1,1”的噪声数据; 5-2.将生成的噪声加入到原始的数据中,然后再放入多层随机神经网络中训练。
相关文献
评论
法律状态详情>>
2020-12-15公开
2020-12-15公开
相关作者
相关机构