10.13266/j.issn.0252-3116.2022.07.012
自有知识增强下的学术全文本关系抽取研究
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现.[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识.研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取.受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上.[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%.
学术全文本、关系抽取、自有知识增强、知识图谱
66
G250(图书馆学、图书馆事业)
江苏省自然科学基金青年项目;国家自然科学基金
2022-04-27(万方平台首次上网日期,不代表论文的发表时间)
共12页
120-131