10.3979/j.issn.1673-825X.202102190048
面向互联网食品文本实体关系联合抽取研究
传统实体关系抽取方法中存在错误传播、实体冗余等问题,食品文本语料中存在主实体对应多个关系的特点,针对此情况,提出一种面向互联网食品文本领域的实体关系联合抽取方法.采用序列标注标签和实体关系匹配规则,将实体关系抽取任务转化为序列标注问题;引入基于位置感知的领域词注意力机制的字词双维度语义编码向量,增强文本的语义表征;在对句子进行字词双维度表示的基础上结合双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)和条件随机场(conditional random field,CRF)构建了序列标注模型(position attention-bidirectional encoder representation from transformer,PA-BERT),实现实体关系联合抽取.对比实验证明,提出的实体关系联合抽取模型在食品数据集上的准确率比常用深度神经网络模型高出6%~11%,在食品文本实体关系抽取中是有效性的.
实体关系抽取、文本序列标注、注意力机制
34
TP391.1(计算技术、计算机技术)
国家重点研发计划;北京市自然科学基金;北京市教委科研计划项目
2022-11-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
812-817