10.3969/j.issn.1003-0077.2023.01.009
多策略中文开放关系抽取方法
开放关系抽取从海量数据中获取知识,是自然语言处理的一个关键技术.开放关系抽取可以实现多种关系的抽取,由于中文领域可供训练的标注数据较少且语义句式较为复杂,面向中文的开放关系抽取存在较多困难.现有的中文开放关系抽取方法存在实体识别覆盖率较低且抽取关系种类单一的问题,无法满足知识图谱扩展等应用需求.该文提出了多策略的开放关系抽取方法,该方法综合利用知识图谱提高了实体识别的覆盖度,依靠实体上下文信息实现了实体对关系的抽取,根据依存句法分析抽取得到全要素三元组,并实现了从文本中抽取实体属性的方法.实验证明,该文的抽取方法准确率高,抽取关系种类多样,可以服务于知识图谱扩展等任务.
开放关系抽取、多策略、知识图谱
37
TP391(计算技术、计算机技术)
国家自然科学基金;NSFC-通用技术基础研究联合基金
2023-03-30(万方平台首次上网日期,不代表论文的发表时间)
共9页
88-96