10.3321/j.issn:1002-8331.2007.05.054
一种基于术语簇和关联规则的文档聚类方法
提出一种新的基于术语簇和关联规则的文档聚类方法.首先对文档集合进行分词,根据术语之间的平均互信息形成术语簇,用术语簇来表示文档矢量空间模型,使用关联规则挖掘文档的初始聚类,对此进行聚类分析获得最终的文档聚类.实验结果表明,与传统的聚类方法相比,其运行速度快,聚类效果和聚类质量都有明显提高.
术语簇、关联规则、文档聚类、Web挖掘、矢量空间模型
43
TP311(计算技术、计算机技术)
国家自然科学基金70571056;河北省科学技术研究与发展计划04213534
2007-04-11(万方平台首次上网日期,不代表论文的发表时间)
共5页
178-181,188