10.13266/j.issn.0252-3116.2018.01.013
基于事件要素的组合模型微博热点事件摘要提取
[目的/意义]为帮助读者从热点事件产生的海量微博报道中快速了解事件的来龙去脉,提高微博事件摘要的准确性和可读性,提出一种基于事件要素的多模型微博热点事件时间轴摘要提取方法.[方法/过程]针对微博文本特征,结合主题模型(LDA)与互信息最大熵模型(MaRxEnt-MI)的特点提取事件摘要关键词,以微博传播价值和主题相关性为标准筛选微博,以时间-摘要关键词-摘要微博的形式生成时间轴摘要.[结果/结论]利用人工标注的测试集,与传统的TextRank方法进行对比,F值提高8%-13%,内部测试表明摘要可读性提高明显.实验文本和测试集的数量及事件丰富度需要进一步扩展,应考虑更多的加权策略模型以提高摘要的准确性.实验结果及测试反馈表明,本文的方法能很好满足用户对热点事件摘要信息需求,提高微博摘要提取的准确率.
文本挖掘、事件摘要、潜在狄利克·雷分布、互信息最大熵模型
62
TP391(计算技术、计算机技术)
国家社会科学基金重大项目“面向学科领域的网络信息资源深度聚合与服务研究”12&ZD221
2018-02-01(万方平台首次上网日期,不代表论文的发表时间)
共10页
96-105