10.3969/j.issn.1672-9722.2022.08.026
一种基于主题划分及TF-IDF的文本摘要提取方法
文本摘要提取作为自然语言处理领域的一项重要任务,是解决信息过载和冗余的有效方法.论文提出了一种基于主题划分及TF-IDF(词频-逆文本频率指数)的文本摘要提取方法,该方法首先将文本段落进行主题划分,其次使用TF-IDF算法对不同主题的文本抽取中心句,最后将各个主题的中心句按顺序合并成文本摘要.将论文提出的文本摘要提取方法分别在知网论文数据集和DUC公共数据集上进行了仿真实验,并和传统方法进行相比分析,实验结果表明,论文提出的方法能有效地提高文本摘要提取的准确性,并且有更好的适应性.
文本摘要、主题划分、TF-IDF、中心句提取
50
TP391.6(计算技术、计算机技术)
2022-09-28(万方平台首次上网日期,不代表论文的发表时间)
共6页
1760-1765