基于自扩展的信息抽取模式自动获取
提出一种从未标注的中文文本中基于自扩展策略自动获取事件抽取模式的算法,该算法从少数几个种子抽取模式开始,通过一个增量迭代的过程发现新的抽取模式,在每一轮迭代中采用类似于TF/IDF的评估方法对产生的候选模式进行排序,选择最优的模式并入当前模式集.应用该方法从人民日报语料中自动获取"职务变动"类事件的抽取模式,实验结果表明,该方法产生的抽取模式在中文文本事件抽取中具有较好的抽取性能,综合指标F值达到66 3%.
信息抽取、抽取模式、自扩展、自动获取
30
TP391(计算技术、计算机技术)
国家自然科学基金项目60663004;教育部博士点基金项目20050007023
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
891-894