10.3969/j.issn.1000-5641.2018.03.007
面向企业知识图谱构建的中文实体关系抽取
企业知识图谱是针对金融领域为描述企业间商业往来关系而构建的一类垂直领域知识库.尽管垂直领域知识图谱在领域覆盖的广度上不如开放知识图谱,但是它对知识准确率的要求却远远高于开放知识图谱,因此虽然近些年开放知识图谱取得了很大的进展,但在垂直领域中却并未得到深入应用,尤其是商业领域,其对企业知识图谱提出了很大的需求.针对企业知识图谱目前在关系抽取效果上的局限性,在分析了实体关系抽取研究现状的基础上,提出了一种基于分类的中文实体关系抽取方法.该方法使用最大熵模型,通过对上市公司公报数据进行实验分析,从而寻找到该关系抽取的最优特征模板,并使在企业公报这一数据集上的准确率普遍达到85%以上.
企业知识图谱、实体关系抽取、最大熵模型
TP391(计算技术、计算机技术)
国家重点研发计划2016YFB1000905;国家自然科学基金广东省联合重点项目U1401256;国家自然科学基金61672234,61402177;华东师范大学信息化软科学研究课题41600-10201-562940/018
2018-07-18(万方平台首次上网日期,不代表论文的发表时间)
共12页
55-66