10.3969/j.issn.1000-3428.2006.21.064
基于种子自扩展的命名实体关系抽取方法
命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量.手工选取少量具有抽取关系的命名实体对,把它们作为初始关系的种子集合,通过自学习,关系种子集合不断扩展.通过计算命名实体对和关系种子之间的上下文相似度来得到所要抽取的命名实体对.通过扩展关系种子集合的方法,抽取的召回率和准确率都得到了提高.该方法在对<人民日报>语料库的测试中,取得了加权平均值F-Score为0.813的效果.
命名实体、关系抽取、自学习
32
TP18(自动化基础理论)
国家自然科学基金60442005;教育部科学技术基金105117
2006-12-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
183-184,193