10.6041/j.issn.1000-1298.2021.01.021
基于注意力机制的农业文本命名实体识别
针对农业智能问答系统构建过程中传统的农业命名实体识别方法依赖人工特征模板、特征信息提取不充分、实体名称多样导致标注不一致等问题,提出一种基于注意力机制的农业文本命名实体识别方法.采用连续词袋模型(Continuous bag of words,CBOW)对输入字向量进行预训练,丰富字向量特征信息,缓解分词准确度对性能的影响;引入文档级的注意力(Attention)机制,获取实体间相似信息,保证实体在不同语境下的标签一致性;基于双向长短期记忆网络(Bi-directional long-short term memory,BiLSTM)和条件随机场(Conditional random field,CRF)模型,构建适合农业领域实体识别的模型框架.选取4 604篇农业文本,针对病害、虫害、农药、农作物品种4类实体进行了识别实验.结果表明,模型能有效地辨别农业文本中的实体,缓解实体标记不一致的问题,在农业语料上达到了较好的结果,识别的准确率、召回率、F值分别为93.48%、90.60%、92.01%.与其他3种识别方法相比,模型在不同规模语料库的准确率均有一定提高,具有明显的性能优势.
农业文本、命名实体识别、注意力机制、神经网络、深度学习
52
TP391.1(计算技术、计算机技术)
国家自然科学基金项目;国家重点研发计划项目;北京市科技计划项目
2021-03-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
185-192