一种面向突发事件的文本语料自动标注方法
事件语料库是研究语义Web中事件知识的抽取、表示、推理和挖掘的基础和关键技术之一.该文以事件作为文本知识单元,在LTP分析的基础上,用序列模式挖掘算法PrefixSpan从现有的小规模语料库中挖掘事件要素的词性规则等,用同义词词林(扩展版)对触发词表进行了扩充,结合自定义的事件要素词典,采用多遍过滤、逐遍完善的思想提出一种针对大规模突发事件语料库构建的自动标注方法,在实验部分不仅与人工标注做了对比,同时与Stanford CoreNLP NER进行了对比,实验效果理想.
突发事件、语料库、自动标注
31
TP391(计算技术、计算机技术)
国家自然科学基金61305053;国家自然科学基金61273328
2017-06-20(万方平台首次上网日期,不代表论文的发表时间)
共10页
76-85