10.3969/j.issn.1001-3695.2018.03.014
一种基于TextRank的单文本关键字提取算法
作为一种经典的文本关键字提取和摘要自动生成算法,TextRank将文本看做若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系.在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结合,提出节点间边权为条件概率的新模型生成算法TextRank Revised.通过对有标记和无标记的验证集进行验证,证明新的算法在不提升时间复杂度的前提下,通过计算单文本得出的单词排序结果相较于原TextRank算法更加吻合人工对文档的关键字提取结果.
TextRank、单文本关键字、提取算法、有向带权图、马尔可夫状态转移模型
35
TP391.1;TP301.6(计算技术、计算机技术)
国家自然科学基金资助项目11501302
2018-05-07(万方平台首次上网日期,不代表论文的发表时间)
共6页
705-710