10.3969/j.issn.1000-3428.2016.06.036
基于依存分析的开放式中文实体关系抽取方法
实体关系抽取是信息抽取的组成部分,其目标是确定实体之间是否存在某种语义关系.由于中文语法错综复杂、表达方式灵活、语义多样等固有性质的限制,导致在中文中以动词作为关系表述容易引起实体间的关系含糊不清.为此,利用依存分析,提出一种开放式中文实体关系抽取方法.对输入的单句进行依存分析,通过依存分析输出的依存弧判断单句是否为动词谓语句,如果是动词谓语句则结合中文语法启发式规则抽取关系表述.根据距离确定论元位置,对三元组进行评估,输出符合条件的三元组.在SogouCA和SogouCS语料库上的实验结果表明,提出的方法适用于大规模语料库,具有较好的性能与可移植性.与基于卷积树核的无监督层次聚类方法相比,F值提高了16.68%.
开放式信息抽取、中文实体关系抽取、依存分析、无监督、启发式规则
42
TP311(计算技术、计算机技术)
上海市科委基金资助项目14511107000
2016-08-19(万方平台首次上网日期,不代表论文的发表时间)
共7页
201-207