10.3969/j.issn.1000-3428.2017.08.037
基于加权TextRank的新闻关键事件主题句提取
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息.通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句.基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句.实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法.
TextRank算法、句子相似度、关键事件、主题句提取、影响权重
43
TP311(计算技术、计算机技术)
国家自然科学基金"基于篇章特征的越南语新闻事件信息抽取关键技术研究"61562049
2017-09-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
219-224