基于句子聚类的中文文本自动摘要算法的研究
文本自动摘要在搜索引擎和新闻内容推荐等多个领域都有着非常广阔的应用.经典的文本摘要算法是提取文本中关键词进行重组,这种方式忽略了文本中句子之间的关联性,而且提取出的关键词通常缺乏语义和语法上关联性.提出了将文本以句子进行划分,针对句子进行聚类,将文本划分为一定数量语义相对固定的单元,对每个语义单元进行核心词发现,最后组合各个语义句子的核心词构建文本摘要,试验结果表明,改进的文本自动摘要算法能够更有效地召回文本主题.
句子聚类、主题词提取、词向量、文本自动摘要
33
TP393(计算技术、计算机技术)
2017-10-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
54-56