DOI：10.11841/j.issn.1007-4333.2022.06.16

基于深度神经网络及隐马尔科夫模型的生猪状态音频识别

引用

摘要：

针对传统音频识别方法在生猪音频信号识别中识别率较低的问题,将深度神经网络及隐马尔可夫模型理论作为生猪音频信号识别依据,以长白猪的吃饭声、发情声、嚎叫声、哼叫声和生病长白猪的喘气声为识别对象,利用卡尔曼滤波和改进的EMD-TEO倒谱距离端点检测算法对生猪音频信号进行预处理,把提取的39维的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为网络学习和识别的数据集,构建基于深度神经网络及隐马尔科夫模型的生猪状态音频识别模型.试验结果表明:1)隐马尔可夫隐状态数设置为5,深度神经网络隐藏层设置为3层,每层128个节点的深度神经网络-隐马尔可夫模型(Deep neural network-hidden Markov model,DNN-HMM),对5种生猪状态音频,即吃饭声、嚎叫声、哼叫声、发情声和病猪喘气声的识别率为70％、95％、75％、80％和95％,总体识别率83％;2)相较于传统的高斯混合模型-隐马尔可夫模型(Gaussian mixture model-hidden Markov model,GMM-HMM),DNN-HMM对相应音频的识别率分别提高了 5％、5％、15％、30％、30％,总体识别率提高了 17％;3)DNN-HMM 模型对于5种不同类型的生猪音频信号均呈现出较好的识别效果.基于DNN-HMM生猪音频识别模型,对生猪不同状态下音频的识别具有较高正确率,且更为可靠.

关键词：生猪、MFCC、卡尔曼滤波、DNN-HMM、识别、音频信号

所属期刊栏目：27

分类号：TP391.4(计算技术、计算机技术)

资助基金：安徽省科技重大攻关项目;安徽省科技重大专项

在线出版日期：2022-06-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：172-181

英文信息展示

期刊专题