10.3969/j.issn.1000-3428.2007.01.073
文本聚类技术的有效性验证
讨论了利用分类测试集进行聚类量化评价的标准.在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比.实验表明,STC聚类算法在处理文本时充分考虑了文本的特性,其聚类效果较好;基于Ant的聚类算法在聚类的划分时效果受参数输入的影响较大,其聚类结果与STC相比并不具有优势;在Ant聚类算法中引入文本特性后,可以提高文本聚类的效果.
文本聚类、聚类有效性验证、后缀树聚类、Ant-based
33
TP391(计算技术、计算机技术)
国家重点实验室网上合作研究平台基金2003DEA5G0407
2007-03-05(万方平台首次上网日期,不代表论文的发表时间)
共3页
209-211