无监督的互联网事件抽取框架
为高效便捷地获取互联网上发布的真实事件信息,提出了一种无监督的互联网事件抽取框架.该框架利用DOM树模型的平行结构特性对表格页面进行事件抽取,并以表格页面抽取的事件作为种子采总结详情页面的对应模式,进一步使用总结的模式在详情页面中抽取.在大量网站页面中应用该框架,并将抽取结果与常用的包装器生成算法进行比较,结果表明了该框架的有效性以及在详情页面中的抽取质量优于包装器算法.
信息抽取、互联网事件抽取、表格网页、详情网页、无监督
32
TP393(计算技术、计算机技术)
2011-07-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
910-913,917