10.16431/j.cnki.1671-7236.2022.07.011
基于机器学习算法的奶牛疾病预测模型的研究
[目的]评估建立奶牛疾病预测模型的6种机器学习(machine learning,ML)算法的性能及预测变量的重要性.[方法]选取2020年12月至2021年11月,共计944头泌乳牛的生产信息、行为信息作为预测因子,疾病信息作为输出变量,训练并验证模型.将日产奶量、反刍量、活动量、胎次和泌乳天数作为输入变量,利用ML算法建立奶牛疾病的预测模型,评估决策树(Decision Tree,DT)C5.0、CHAID算法、人工神经网络(Artificial Neural Network,ANN)、随机森林(Random Forests,RF)、贝叶斯网络(Bayesian Networks,BN)和逻辑回归(Logistic Regression,LR)6种ML算法的性能,评估预测变量的重要性,以及将胎次和泌乳天数纳入预测变量后模型性能的改善情况.采用敏感性和特异性评估模型性能,按照权重排序评估输入变量对模型预测的重要性.[结果]DTC5.0算法敏感性>85%,特异性>90%,为性能最佳的模型;RF总敏感性为56.8%,对各类牛预测的性能较稳定;ANN、BN、DT CHAID则对样本量较多的疾病预测性能较好,可达74.4%;LR对病牛正确识别率不足40.0%,大多识别为健康牛.产奶量为RF、ANN、LR最重要的预测变量,泌乳天数为DT C5.0、CHAID和BN最重要的预测变量;纳入胎次和泌乳天数后,模型预测的敏感性平均提高9.8%.[结论]ML算法在对奶牛疾病的预测方面表现出很大潜力,其中,DT C5.0更适合用于预测奶牛疾病.产奶量和泌乳天数为疾病预测模型中相对重要的变量,此外,将胎次和泌乳天数纳入预测变量,可提高模型的预测精度.
奶牛、机器学习、疾病预测
49
TP181(自动化基础理论)
现代农业产业技术体系
2022-08-02(万方平台首次上网日期,不代表论文的发表时间)
共13页
2534-2546