基于ERNIE-RCNN梅花研究信息文本分类方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1005-9369.2022.05.003

基于ERNIE-RCNN梅花研究信息文本分类方法

引用
采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础.为探究文本分类方法应用于梅花研究信息的可行性,提出基于改进ERNIE-RCNN的梅花研究信息文本分类方法.针对缺乏梅花研究信息数据集导致常用文本分类方法分类效果不佳的问题,构建包含6个研究方向的中文梅花研究信息文本数据集;针对传统分类模型的编码机制难以体现文本逻辑性、语义还原不精确的问题,引入预训练模型ERNIE对文本进行编码,在编码过程中增强对文本特征提取与语义表示的能力;为更好保留文本词序及特征,提高分类正确性,在ERNIE模型编码基础上融合TextRCNN模型进行分类,改进TextRCNN模型卷积层丢弃率,增强分类模型泛化性,提高分类能力.通过对改进ERNIE-RCNN模型与仅改进ERNIE的ERNIE-RCNN模型、原始ERNIE-RCNN模型、ERNIE模型、BERT模型以及TextRCNN模型进行对比,试验结果表明,改进ERNIE-RCNN模型在不同评价指标上均高于其他模型,精准率、召回率和F1值分别不小于91.53%、90.27%、92.35%,正确率为95.35%.基于改进ERNIE-RCNN的梅花研究信息文本分类方法可满足实际需要.

梅花、研究信息、文本分类、ERNIE、TextRCNN、深度学习

53

TP391.1(计算技术、计算机技术)

国家自然科学基金;国家自然科学基金

2022-07-14(万方平台首次上网日期,不代表论文的发表时间)

共12页

20-31

相关文献
评论
暂无封面信息
查看本期封面目录

东北农业大学学报

1005-9369

23-1391/S

53

2022,53(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn