10.11772/j.issn.1001-9081.2014.01.0064
基于弱监督的属性关系抽取方法
针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法.首先,利用中文百科条目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语料;最后,基于条件随机场(CRF)建立属性关系抽取模型.在互动百科中采集的数据集上进行实验,综合评价F值达到了80.9%.结果表明该方法能够获得质量较高的训练语料,并取得良好的抽取性能.
关系抽取、弱监督、中文百科、朴素贝叶斯分类、条件随机场
34
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61170111,61202043,61262058;中央高校基本科研业务费专项资金资助项目SWJTU11ZT08;中国科学院自动化所复杂系统管理与控制重点实验室开放课题20110102
2014-03-03(万方平台首次上网日期,不代表论文的发表时间)
共5页
64-68