10.11896/j.issn.1002-137X.2018.12.020
基于触发词语义选择的Twitter事件共指消解研究
随着社交媒体的发展与普及,如何识别短文本中事件描述的共指关系已成为一个亟待解决的问题.在传统的事件共指消解研究中,需要从NLP工具和知识库中获得丰富的语义特征,这种方式不仅限制了领域的扩展性,而且还导致了误差传播.为了打破上述局限,提出了一种新颖的基于事件触发词来选择性表达句子语义的方法,以判断短文本中事件的共指关系.首先,利用双向长短记忆模型(Bi-LSTM )提取短文本的句子级语义特征和事件描述级语义特征;其次,通过在句子级特征上应用一个基于事件触发词的选择门来选择性表达句子级语义,以产生潜在语义特征;然后,设计了触发词重叠词数和时间间隔两个辅助特征;最后,通过融合以上特征形成一个分类器来预测共指关系.为评估上述方法,基于Twitter数据标注了一个新的数据集EventCoreOnTweets(ECT).实验结果表明,与两个基准模型相比,提出的选择性表达模型显著提升了短文本共指消解的性能.
事件共指消解、短文本、双向长短记忆模型、神经网络
45
TP391(计算技术、计算机技术)
国家自然科学基金-青年科学基金项目61602490;国家重点研发计划:众智化专业知识协同开发技术及应用2017YFB1402403
2019-01-17(万方平台首次上网日期,不代表论文的发表时间)
共8页
130-136,147