10.16337/j.1004-9037.2017.03.011
基于滑动窗口的微博时间线摘要算法
时间线摘要是在时间维度上对文本进行内容归纳和概要生成的技术.传统的时间线摘要主要研究诸如新闻之类的长文本,而本文研究微博短文本的时间线摘要问题.由于微博短文本内容特征有限,无法仅依靠文本内容生成摘要,本文采用内容覆盖性、时间分布性和传播影响力3种指标评价时间线摘要,并提出了基于滑动窗口的微博时间线摘要算法(Microblog timeline summariaztion based on sliding window,MTSW).该算法首先利用词项强度和熵来确定代表性词项;然后基于上述3种指标构建出评价时间线摘要的综合评价指标;最后采用滑动窗口的方法,遍历时间轴上的微博消息序列,生成微博时间线摘要.利用真实微博数据集的实验结果表明,MTSW算法生成的时间线摘要可以有效地反映热点事件发展演化的过程.
微博摘要、时间线摘要、短文本摘要、事件演化
32
TP391(计算技术、计算机技术)
江苏省高校自然科学基金13KJB520014
2017-07-26(万方平台首次上网日期,不代表论文的发表时间)
共10页
523-532