10.11841/j.issn.1007-4333.2022.06.16
基于深度神经网络及隐马尔科夫模型的生猪状态音频识别
针对传统音频识别方法在生猪音频信号识别中识别率较低的问题,将深度神经网络及隐马尔可夫模型理论作为生猪音频信号识别依据,以长白猪的吃饭声、发情声、嚎叫声、哼叫声和生病长白猪的喘气声为识别对象,利用卡尔曼滤波和改进的EMD-TEO倒谱距离端点检测算法对生猪音频信号进行预处理,把提取的39维的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为网络学习和识别的数据集,构建基于深度神经网络及隐马尔科夫模型的生猪状态音频识别模型.试验结果表明:1)隐马尔可夫隐状态数设置为5,深度神经网络隐藏层设置为3层,每层128个节点 的深度神经网 络-隐马尔可夫模型(Deep neural network-hidden Markov model,DNN-HMM),对5种生猪状态音频,即吃饭声、嚎叫声、哼叫声、发情声和病猪喘气声的识别率为70%、95%、75%、80%和95%,总体识别率83%;2)相较于传统的高斯 混合模型-隐马尔可夫模型(Gaussian mixture model-hidden Markov model,GMM-HMM),DNN-HMM对相应音频的识别率分别提高了 5%、5%、15%、30%、30%,总体识别率提高了 17%;3)DNN-HMM 模型对于5种不同类型的生猪音频信号均呈现出较好的识别效果.基于DNN-HMM生猪音频识别模型,对生猪不同状态下音频的识别具有较高正确率,且更为可靠.
生猪、MFCC、卡尔曼滤波、DNN-HMM、识别、音频信号
27
TP391.4(计算技术、计算机技术)
安徽省科技重大攻关项目;安徽省科技重大专项
2022-06-23(万方平台首次上网日期,不代表论文的发表时间)
共10页
172-181