基于词语对狄利克雷过程的时序摘要
时序摘要是按照时间顺序生成摘要,对话题的演化发展进行概括。已有的相关研究忽视或者不能准确发现句子中隐含的子话题信息。针对该问题,本文建立了一种新的主题模型,即词语对狄利克雷过程,并提出了一种基于该模型的时序摘要生成方法。首先通过模型推理得到句子的子话题分布;然后利用该分布计算句子的相关度和新颖度;最后按时间顺序抽取与话题相关且新颖度高的句子组成时序摘要。实验结果表明,本文方法较目前的代表性研究方法生成了更高质量的时序摘要。
时序摘要、狄利克雷过程、词语对、主题模型
TN1;H31
国家社会科学基金14BXW028资助Supported by National Social Science Foundation of China 14BXW028
2015-09-09(万方平台首次上网日期,不代表论文的发表时间)
共9页
1452-1460