10.3969/j.issn.1006-2475.2012.02.009
一种适用于短消息文本的聚类算法
针对短消息文本聚类,设计基于频繁词集和Ant-Tree的混合聚类方法.该算法利用基于频繁词集聚类算法处理文本数据的效率优势,生成初始聚簇,计算轮廓系数消除重叠文档,在此基础上再通过Ant-Tree算法继续精化,最终得到高质量的结果输出.而且聚类结果保留了描述信息和树状层级结构,提供了更广阔的应用.
频繁词集、Ant-Tree算法、轮廓系数、短消息、聚类
TP301.6(计算技术、计算机技术)
湖南省教育厅资助科研项目09C1163
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
31-34