10.3969/j.issn.1000-3428.2010.05.030
基于语义密度的文本聚类研究
结合文本数据的语义相似度,给出一种基于语义密度文本数据聚类的方法.根据文本数据的特点,从一个随机选定的文本对象出发,向文本数据最为密集的区域扩张,组织成一个能反映语料结构的有序序列进行聚类.在处理噪声文本数据的过程中,利用有效结果重组策略来辅助噪声文本数据重新定位.实验结果表明,该方法具有良好的聚类性能.
密度、簇、邻域、聚类
36
TP311(计算技术、计算机技术)
国家自然科学基金资助项目60632050;2009年度淮安科技基金资助项目"基于语义的垃圾短信分类器设计与实现"HAG09061;淮阴工学院基金资助重点项目HGA0907
2010-05-18(万方平台首次上网日期,不代表论文的发表时间)
共3页
81-83