10.3969/j.issn.1673-4785.2015.01.015
基于弱监督学习的中文网络百科关系抽取
实体关系抽取在信息检索、自动问答、本体学习等领域都具有重要作用。提出了基于弱监督学习的关系抽取框架。首先利用知识库中已有结构化的关系三元组,从自然语言文本中自动获取训练语料;针对训练语料数量较少导致特征不足的问题,采用基于朴素贝叶斯的句子分类器和基于自扩展的训练方法,从未标注数据中获取更多的训练语料;然后利用条件随机场模型训练关系抽取器。实验结果表明所提方法的有效性,有现有方法相比,文中方法获得较高的准确率。
知识获取、信息抽取、关系抽取、弱监督学习、自扩展、中文网络百科、条件随机场、朴素贝叶斯
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61170111,61134002,61202043,61262058.
2015-03-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
113-119