10.6041/j.issn.1000-1298.2020.07.028
面向食品安全事件新闻文本的实体关系抽取研究
为解决从大规模网络文本中快速、准确识别食品安全事件并进行实体关系抽取受中文复杂语法特性限制的问题,提出一种基于依存分析的面向食品安全事件新闻文本的实体关系抽取方法FSE_ERE(Entity relation extraction of food safety events,FSE_ERE).该方法结合句子的依存分析结果和实体关系抽取模型,对非结构化中文文本进行无监督的实体关系抽取,并引入一种将文本相似度结合到PU学习(Positive and unlabeled learning)的半监督分类方法,利用改进的特征加权处理方法提高分类精度,使得FSE_ERE方法能够在高质量的食品安全事件新闻文本中完成实体关系抽取工作.实验结果表明,FSE_ERE方法在食品安全事件新闻文本数据集和多类型混合新闻文本数据集上的实体关系抽取均达到了先进的性能,F值分别达到了71.21%和67.42%,证明了FSE_ERE方法的有效性和可移植性.
食品安全事件、实体关系抽取、依存分析、PU学习、文本相似度
51
TP391;TP311(计算技术、计算机技术)
国家重点研发计划项目;现代农业产业技术体系北京市生猪产业创新团队项目;国家蛋鸡产业技术体系项目;“十二五”国家科技支撑计划项目
2020-08-13(万方平台首次上网日期,不代表论文的发表时间)
共10页
244-253