基于文本聚类技术的主题发现
阐述了一种主题发现系统,它能发现数据流中的隐含知识,并将其表述为含有主题/副主题的层次树,每个主题包含与其相关的文档集和文档摘要,以便于用户从层次树中浏览和选择所需主题.并提出了一种增量层次聚类算法,该算法结合了划分聚类和凝聚聚类的主要优点.实验结果表明,无论是作为主题检测系统还是分类和概括工具,该算法都是高效的.
文本聚类、主题发现、层次方法、簇、文本挖掘
29
TP391(计算技术、计算机技术)
2008-05-22(万方平台首次上网日期,不代表论文的发表时间)
共4页
1426-1428,1432