10.3969/j.issn.1000-7024.2006.15.012
文本主题的自动提取方法研究与实现
在深入分析了当前流行的文本主题提取技术和方法的基础上,将语义方法融入统计算法,提出了一种基于统计的主题提取方法,并描述了它的实现过程.该方法利用文档内句子之间的语义相关性,实现了文本主题的自动生成.首先对文本进行切词和分句处理实现信息分割,再结合文本聚类技术对文本句进行聚类实现信息合并,最后从每类中抽取代表句生成文本主题.实验结果表明,该方法是一个有效、实用的方法.
文本主题、自动文摘、文本分段、文本聚类、向量空间模型、文本模型
27
TP391;TP18(计算技术、计算机技术)
甘肃省教育厅科研项目0416B-04
2006-09-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
2744-2746,2766