10.3969/j.issn.2096-9473.2022.03.009
面向农业领域的问答系统问句分类研究
针对目前农业问答系统领域缺少语料库的问题,使用Python爬虫获取了5类共计28 608条问答句对文本数据,并对获取的文本数据进行了数据清洗、分词等预处理,构建了一个可用于问答系统研究的农业文本语料库.对获取问句进行分析,发现问句文本长度集中在30个字符以内,列出了各种文本的主题分布情况.采用TextCNN模型对问句进行分类,最好的宏平均F1值为88.762,结果证明本文所建语料的可用性,带标注的语料库构建对农业问答领域的研究具有重要意义.
语料库构建、农业问答、自然语言处理、数据分析
50
TP391(计算技术、计算机技术)
河南省高等学校重点科研项目;河南省科技攻关项目;河南省科技攻关项目;河南省科技攻关项目;河南科技学院交叉学科培育项目
2022-09-19(万方平台首次上网日期,不代表论文的发表时间)
共8页
63-70