DOI：10.3969/j.issn.2095-2163.2023.09.015

基于Stacking集成学习的中文问句分类算法

引用

摘要：

为提升中文问句分类的效果,改善单模型问句分类受训练数据及模型参数影响大、场景适应性差、泛化能力弱等问题,本文提出一种基于Stacking集成学习的中文问句分类算法.模型使用集成学习Stacking框架,融合LightGBM、XGBoost和Random Forest构建多基分类器,并利用Logistic Regression作为元分类器,实现中文问句分类,以提高模型的泛化能力,并提升分类精度.通过网络开源中文问句数据集对模型进行训练和验证,实验结果表明,本文提出的基于Stacking的中文问句分类模型相比于最优LightGBM单模型,在F1 值上提升了 2.82%.因此,基于Stacking集成学习的中文问句分类算法能够有效提升中文问句分类的精度,支撑问答系统实现更好的性能.

关键词：问答系统、中文问句分类、集成学习、Stacking

所属期刊栏目：13

分类号：G356;TP391.1(情报学、情报工作)

在线出版日期：2023-10-08（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：85-88

英文信息展示

期刊专题