10.16058/j.issn.1005-0930.2022.06.007
基于类别特征编码的参考作物蒸散量预报模型
为提高基于天气预报的参考作物蒸散量(ETo)预报模型精度,通过引入序数(ORD),独热(O-H),目标(TAR)和CatBoost(CAT)4种编码方法对天气类型和风力等级进行数值化处理,结合Light Gradient Boosting Decision Machine(LGB)算法构建了基于天气预报类别特征的ETo预报模型.结果表明,同时引入编码处理的天气类型和风力等级数据可以有效提升LGB3模型精度(R2较LGB1提升-0.97%-9.36%),提升排名为O-H>CAT>TAR>ORD.单独引入天气类型数据的LGB4能够获得与LGB3模型相近的精度,而单独引入风力等级对LGB5模型精度贡献不显著,甚至可能会引入噪声而降低精度.因此采用0-H编码处理天气类型和风力等级数据扩展输入维度,可以提高模型精度,适用于缺少气象站或数据种类不全地区的ETo精准预测.
参考作物蒸散量、天气预报、机器学习、数据预处理、类别特征编码
30
S161.4(农业气象学)
国家自然科学基金;江苏省研究生科研创新计划项目
2022-11-28(万方平台首次上网日期,不代表论文的发表时间)
共18页
1402-1419