10.3969/j.issn.1002-8978.2016.07.022
一种非监督的事件触发词检测和分类方法
事件触发词检测和分类是事件抽取中至关重要的第一步.传统的抽取和分类方法往往倾向于监督学习方法,如条件随机场、SVM等,但由于这类方法需要繁重的人工标注且受限于预先定义好的类别,因此很难在开放领域中得到应用.提出了一种非监督的事件触发词检测和分类方法,利用主题模型获取候选触发词在主题上的分布,然后利用二值状态自动机模型捕获高概率的主题,从而筛选出真正的事件触发词和相应的分类.在大规模的未标注新浪新闻数据集上的实验结果充分验证了本文方法的有效性.
事件触发词检测和分类、主题模型、二值状态自动机模型
35
TP3(计算技术、计算机技术)
国家自然科学基金61331017
2016-10-09(万方平台首次上网日期,不代表论文的发表时间)
共5页
91-95