微博客蕴含交通事件信息抽取的自动标注方法
微博客文本蕴含丰富的实时交通事件信息,能够为现有交通信息采集手段提供补充.然而,当前事件抽取方法缺少对地理实体关系的判断过程,对涉及多个地理实体及关系表达的地理空间要素抽取效果不佳,难以准确识别交通事件信息的位置描述.该文提出一种自动标注方法,将地理实体关系识别引入事件抽取过程来解决这一问题.该方法利用条件随机场模型实现交通事件角色标注,利用支撑向量机模型实现角色关系与要素关系标注,完成了交通事件信息空间要素识别.以新浪微博为数据源开展的实验分析表明,该文所提出的微博客蕴含交通事件抽取方法,正确率和召回率均达到90%,优于现有的基于模式匹配的抽取方法.
微博客、信息抽取、交通事件、条件随机场、支撑向量机
31
TP391(计算技术、计算机技术)
国家自然科学基金41631177;国家自然科学基金41401460
2017-06-20(万方平台首次上网日期,不代表论文的发表时间)
共10页
107-116