10.19734/j.issn.1001-3695.2022.10.0540
融合依存信息的关系导向型实体关系抽取方法
中文实体关系抽取多以字符序列处理文本,存在字符语义表征不足、长字符序列语义遗忘等问题,制约了远距离实体的召回率,为此提出了一种融合依存句法信息的关系导向型抽取方法.输入层以字符序列和基于同义词表示的词序列为输入;编码端用长短时记忆网络(LSTM)进行文本编码,并加入全局依存信息,用于产生关系门的表示;解码端加入依存类型信息,并在关系门的作用下,用双向长短时记忆网络(BiLSTM)解码得到实体关系三元组.该方法在SanWen、FinRE、DuIE、IPRE中文数据集上的F1 值分别较基线方法提高5.84%、2.11%、2.69%和0.39%.消融实验表明,提出的全局依存信息和依存类型信息表示方法均可提升抽取性能,对长句和远距离实体的抽取性能也稳定地优于基线方法.
实体关系抽取、依存句法分析、剪枝、关系导向、同义词
40
TP391(计算技术、计算机技术)
国家社会科学基金;重庆市教育科学规划课题资助项目;重庆理工大学研究生教育高质量发展行动计划资助项目
2023-05-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
1410-1415,1440