10.3969/j.issn.2095-2163.2023.09.015
基于Stacking集成学习的中文问句分类算法
为提升中文问句分类的效果,改善单模型问句分类受训练数据及模型参数影响大、场景适应性差、泛化能力弱等问题,本文提出一种基于Stacking集成学习的中文问句分类算法.模型使用集成学习Stacking框架,融合LightGBM、XGBoost和Random Forest构建多基分类器,并利用Logistic Regression作为元分类器,实现中文问句分类,以提高模型的泛化能力,并提升分类精度.通过网络开源中文问句数据集对模型进行训练和验证,实验结果表明,本文提出的基于Stacking的中文问句分类模型相比于最优LightGBM单模型,在F1 值上提升了 2.82%.因此,基于Stacking集成学习的中文问句分类算法能够有效提升中文问句分类的精度,支撑问答系统实现更好的性能.
问答系统、中文问句分类、集成学习、Stacking
13
G356;TP391.1(情报学、情报工作)
2023-10-08(万方平台首次上网日期,不代表论文的发表时间)
共4页
85-88