一种基于词覆盖的新闻事件脉络链构建方法
针对目前构建新闻脉络链只关注新闻脉络链的主题相似性和文档重要性,而忽略新闻脉络链逻辑连贯性和可解释性的不足,以及新闻数据集合指数级增长带来的算法复杂度问题,从词覆盖的角度提出一种新闻脉络链构建方法,利用新闻的评论信息来定位新闻事件转折点,用主题相似与稀疏差异的思想以及RPCA方法对文档进行逻辑建模,利用随机游走以及图遍历的方法,量化并生成可解释且具有很好逻辑连贯性的脉络链.双盲实验表明,与其他算法相比,该方法取得较好的效果.
新闻脉络、词覆盖、可解释、健壮主成分分析、随机游走
52
TP391(计算技术、计算机技术)
广东省前沿与关键技术创新专项2014B010112006;广东省产学研省部合作专项资金2013B090500087
2017-01-18(万方平台首次上网日期,不代表论文的发表时间)
共9页
104-112