10.19586/j.2095-2341.2022.0007
基于机器学习的微生物溶解有机碳含量估测
微生物群落会对所处环境的宏观性质产生重要影响,但微生物存在数据高维、复杂、稀疏的特点,为了解微生物与生态环境之间的关系提出了新的挑战.机器学习的发展以及第二代DNA测序技术应用的普及为解决这一问题提供了一种新的方法.利用308个样本共44 d的植物凋落物分解实验的土壤微生物群和溶解有机碳(dissolved organic carbon,DOC)数据,并以1 709个细菌微生物操作分类单元(operational taxonomic units,OTU)作为特征构建12种常用的机器学习模型,采用嵌入法、包装法以及嵌入-包装融合法进行特征选择,并选择梯度提升决策树(gradient boosting decision tree,GBDT)作为最优模型进行参数优化.模型采用均方根误差、平均绝对误差、线性拟合优度作为评价指标.结果表明,特征筛选后降低了数据维度,提升了模型精度,在仿真实验中,嵌入-包装融合法在应用模型中表现最佳.将嵌入-包装融合法与梯度提升决策树结合构建溶解有机碳预测模型,并通过实验验证了模型的有效性.研究结果为利用细菌微生物数据应用机器学习方法估测溶解有机碳提供了新思路.
机器学习、微生物、特征筛选、建模预测、有机碳
13
TP181;Q93(自动化基础理论)
新疆畜牧科学院畜牧研究所基础研究项目2020BD1002-2-2-2
2023-09-26(万方平台首次上网日期,不代表论文的发表时间)
共9页
645-653