10.13705/j.issn.1671-6841.2021394
基于改进TextRank的关键句提取方法
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性.TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征.基于此,提出了一种改进TextRank算法,将相似语句合并后,考虑多种词特征进行关键句选取.首先,计算语句相似度,并且去除文中相似性较高的语句;然后,根据词频、词义、词位置对词语打分,构建有向图;最后,计算语句平均得分进行排序,选出关键句.实验结果表明,改进后的算法准确性优于其他算法,算法的时间复杂度降低,并且解决了关键词对文本描述片面和摘要烦琐的问题.
关键句提取、改进TextRank算法、相似句合并、词特征
55
TP391.1(计算技术、计算机技术)
国家自然科学基金;国家重点研发计划;北京市社会科学项目
2023-01-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
15-20