10.3969/j.issn.1007-130X.2023.11.017
一种基于共现关键词的TextRank文摘自动生成算法
传统TextRank算法在生成摘要时只考虑句子间的相似度,忽略了文章本身间的相似度,且生成的摘要往往包含重复的信息表达.为此,提出一种基于共现关键词的TextRank算法,用word2vec模型将文章表示为句向量,考虑到文章的类别,将该类文章的共现关键词作为参数参与句子权值的迭代计算,然后,通过句子长度、关键词数量等信息对迭代得到的句子权重加以修正.实验结果表明,所提算法能够提高生成摘要的全面性和准确性.同时,所提算法使用MMR对抽取得到的摘要进行去除冗余处理,改善了摘要的重复表达情况.
自动摘要生成、TextRank、共现关键词、MMR算法、word2vec模型
45
TP391(计算技术、计算机技术)
教育部产学合作协同育人项目;河北省高等教育教学改革研究与实践项目
2023-11-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
2060-2069