基于机器学习的猪生长性状基因组预测
为了比较自动机器学习下不同机器学习模型预测部分猪生长性状与全基因组估计育种值(genomic estimated breeding value,GEBV)的性能,并寻找适合的机器学习模型,以优化生猪育种的全基因组评估方法,本研究利用来自多个公司 9968 头猪的基因组信息、系谱矩阵、固定效应及表型信息通过自动机器学习方法获取深度学习(deep learning,DL)、随机森林(random forest,RF)、梯度提升机(gradient boosting machine,GBM)和极致梯度提升(extreme gradient boosting,XGB)4 种机器学习最佳模型.采用 10 折交叉验证分别对猪达 100 kg校正背膘(correcting backfat to 100 kg,B100)、达 115 kg校正背膘(correcting backfat to 115 kg,B115)、达 100 kg校正日龄(correcting days to 100 kg,D100)、达 115 kg校正日龄(correcting days to 100 kg,D115)的GEBV及其表型进行预测,比较不同机器学习模型应用于猪基因组评估的性能.结果表明:机器学习模型对GEBV的估计准确性高于性状表型;在GEBV预测中,GBM在B100、B115、D100、D115 的预测准确性分别为 0.683、0.710、0.866、0.871,略高于其他方法;在表型预测中,对猪B100、B115、D100、D115 预测性能最好的模型依次为GBM(0.547)、DL(0.547)、XGB(0.672、0.670);在模型训练所需时间上,RF远高于其他 3 种模型,GBM与DL居中,XGB 所需时间最少.综上所述,通过自动机器学习获取的机器学习模型对 GEBV预测的准确性高于表型;GBM模型总体上表现出最高的预测准确性与较短训练时间;XGB能够利用最短的时间训练准确性较高的预测模型;RF模型的训练时间远超其他 3 种模型,且准确性不足,不适用猪生长性状表型与GEBV预测.
基因组估计育种值、生长性状、自动机器学习、性能比较
45
S811.3;S511.032;Q344
2023-11-03(万方平台首次上网日期,不代表论文的发表时间)
共11页
922-932