10.3969/j.issn.1001-3695.2017.08.008
基于超图的汉越双语新闻话题要素提取
针对汉越双语新闻话题文本集合中新闻话题要素提取的问题进行了研究,在超图模型的基础上,运用了PageRank随机游走排序方法.首先根据触发词激励的方法提取新闻中的事件要素;然后在此基础上构建话题超图模型,将汉越事件要素作为节点,将文本集合中的句子作为超边,根据概率评估函数计算节点和超边的初始权重;最后采用PageRank随机游走方法对汉越事件要素进行评分,最终得到汉越话题要素.实验结果表明,该方法相比只考虑单文本事件要素提取方法的效果有显著提高,说明了基于超图的PageRank方法提取新闻话题要素的准确性.
汉越双语、事件要素、超图、随机游走、话题要素
34
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目61562049
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
2278-2281